崗位職責(zé):
負(fù)責(zé)企業(yè)級(jí)AI系統(tǒng)架構(gòu)設(shè)計(jì)、技術(shù)選型與核心模塊開(kāi)發(fā),構(gòu)建高可用、可擴(kuò)展的AI基礎(chǔ)設(shè)施。
主導(dǎo)機(jī)器學(xué)習(xí)/深度學(xué)習(xí)模型全流程開(kāi)發(fā),包括設(shè)計(jì)、訓(xùn)練、優(yōu)化與部署,確保模型高效性和業(yè)務(wù)適配性。
開(kāi)發(fā)AI工程化解決方案(如基于Nvidia AI技術(shù)棧),如分布式訓(xùn)練框架、模型服務(wù)化及自動(dòng)化推理流水線。
設(shè)計(jì)AI系統(tǒng)性能優(yōu)化方案,涵蓋計(jì)算資源調(diào)度、模型壓縮與量化加速。
制定AI開(kāi)發(fā)規(guī)范與工程標(biāo)準(zhǔn),建立模型版本管理、監(jiān)控告警、A/B測(cè)試等MLOps體系。
跟蹤前沿AI技術(shù),推動(dòng)技術(shù)成果在業(yè)務(wù)場(chǎng)景中落地,實(shí)現(xiàn)AI解決方案規(guī)?;瘧?yīng)用。
任職要求:
3年以上AI工程化開(kāi)發(fā)經(jīng)驗(yàn),熟悉分布式系統(tǒng)設(shè)計(jì)與高并發(fā)優(yōu)化,具備CUDA編程經(jīng)驗(yàn)優(yōu)先。
深入理解機(jī)器學(xué)習(xí)原理,掌握Transformer等主流模型架構(gòu)及其工程實(shí)現(xiàn)。
熟悉Nvidia AI技術(shù)棧優(yōu)先,如NIM、Nemo、vGPU、ruanAI等。
熟悉Docker/Kubernetes云原生技術(shù)棧,熟悉LLM微調(diào)部署、RAG應(yīng)用開(kāi)發(fā)等生成式AI技術(shù)。
具備技術(shù)前瞻性與系統(tǒng)設(shè)計(jì)能力,能快速轉(zhuǎn)化前沿AI論文成果,平衡技術(shù)先進(jìn)性與工程可行性。
具備責(zé)任心與自驅(qū)力,適應(yīng)快節(jié)奏技術(shù)迭代環(huán)境,有出色的技術(shù)文檔撰寫與方案宣講能力。
計(jì)算機(jī)科學(xué)、數(shù)學(xué)、統(tǒng)計(jì)學(xué)或相關(guān)專業(yè)本科及以上學(xué)歷。