在线欧美精品一区二区三区,荫道bbwbbb高潮潮喷,一本色道久久综合一

登錄/注冊(cè) 我要招人

400-885-9898

更新于 8月13日

APP

舉報(bào)

推理加速高級(jí)算法工程師（工作地點(diǎn)優(yōu)先蕪湖，天津也可，薪資面談）

1000元以下

天津南開(kāi)區(qū)
3-5年
本科
全職
招1人

職位描述

MLAAI模型推理優(yōu)化GPU硬件架構(gòu)CUDA/CUTLASS

工作地點(diǎn)優(yōu)先蕪湖，天津也可，薪資面談

職位描述：

1. 引領(lǐng)大模型推理性能優(yōu)化：負(fù)責(zé)全球領(lǐng)先的大規(guī)模語(yǔ)言模型（LLM）推理性能優(yōu)化，挑戰(zhàn)世界級(jí)技術(shù)難題，顯著降低推理時(shí)延，提升吞吐量，并大幅降低推理成本，推動(dòng)AI技術(shù)的邊界。

2. 深度參與前沿技術(shù)研發(fā)：探索并實(shí)現(xiàn)先進(jìn)的推理優(yōu)化技術(shù)，如FlashAttention、PageAttention、Continuous Batching、Speculative Decoding等，確保我們的推理引擎在全球范圍內(nèi)保持技術(shù)領(lǐng)先地位。

3. 跨硬件平臺(tái)的極致優(yōu)化：針對(duì)不同硬件架構(gòu)（如GPU、TPU等），設(shè)計(jì)并實(shí)現(xiàn)高效的推理加速方案，結(jié)合剪枝、量化、分布式推理等技術(shù)，最大化硬件利用率，提升系統(tǒng)整體性能。

4. 推動(dòng)AI推理引擎的創(chuàng)新：深入理解并優(yōu)化主流推理引擎（如vLLM、sglang），結(jié)合CUDA/Cutlass等底層開(kāi)發(fā)工具，打造高性能、低延遲的推理框架，為全球用戶提供極致的推理體驗(yàn)。

職位要求：

1. 深厚的模型架構(gòu)理解：熟悉Transformer、LLaMA、DeepSeek等主流大模型架構(gòu)，能夠深入理解并優(yōu)化其推理過(guò)程。

2. 前沿推理技術(shù)掌握：精通LLM推理引擎（如vLLM、sglang），熟悉MLA、FlashAttention、PageAttention、Continuous Batching、Speculative Decoding等推理優(yōu)化技術(shù)，具備實(shí)際應(yīng)用經(jīng)驗(yàn)。

3. 豐富的推理優(yōu)化經(jīng)驗(yàn)：具備AI模型推理優(yōu)化的實(shí)戰(zhàn)經(jīng)驗(yàn)，熟悉剪枝、量化、分布式推理等加速技術(shù)，能夠根據(jù)不同場(chǎng)景和硬件平臺(tái)進(jìn)行針對(duì)性優(yōu)化。

4. 硬件與底層開(kāi)發(fā)能力：熟悉GPU硬件架構(gòu)，具備CUDA/Cutlass開(kāi)發(fā)與優(yōu)化經(jīng)驗(yàn)，能夠深入底層進(jìn)行性能調(diào)優(yōu)。

5. 全球視野與創(chuàng)新精神：具備強(qiáng)烈的技術(shù)好奇心與創(chuàng)新意識(shí)，愿意挑戰(zhàn)世界級(jí)難題，推動(dòng)AI推理技術(shù)的全球突破。

工作地點(diǎn)

天津南開(kāi)區(qū)宜賓道

完善一份簡(jiǎn)歷
1736萬(wàn)+企業(yè)在線搜索，780萬(wàn)+海量職位精準(zhǔn)推薦

相似職位

推理加速高級(jí)算法工程師（工作地點(diǎn)優(yōu)先蕪湖，天津也可，薪資面談）1000元以下
天津 - 南開(kāi)
安徽提爾液冷科技有限公司
推薦搜索算法工程師2-3萬(wàn)
天津 - 和平
天津鷹眼智能科技有限公司

查看更多相似職位

職位發(fā)布者

王彬杰/人事經(jīng)理

剛剛活躍

立即溝通

安徽提爾液冷科技有限公司

安徽提爾液冷科技有限公司成立于2024年1月，公司致力于為全球用戶提供先進(jìn)、低碳、綠色數(shù)字基礎(chǔ)設(shè)施及智算力運(yùn)營(yíng)。公司主要業(yè)務(wù)為單相浸沒(méi)液冷數(shù)據(jù)中心設(shè)備銷售、數(shù)據(jù)中心建設(shè)與算力運(yùn)營(yíng)。公司擁有的浸沒(méi)液冷全棧一體化解決方案可以通過(guò)儲(chǔ)能方式讓智算集群消納綠電并低成本回收余熱，實(shí)現(xiàn)數(shù)據(jù)中心的負(fù)碳運(yùn)行。

公司主頁(yè)