崗位職責(zé) :
1. 模型研究與算法驗(yàn)證
- 負(fù)責(zé)大語言模型技術(shù)研究,主導(dǎo)模型訓(xùn)練策略優(yōu)化及性能驗(yàn)證,提升模型在復(fù)
雜場景下的準(zhǔn)確性與魯棒性。
- 推進(jìn)模型微調(diào)、量化壓縮、推理加速等技術(shù)落地,解決訓(xùn)練過程中的工程難題
(如分布式并行、內(nèi)存優(yōu)化)。
2. 數(shù)據(jù)與實(shí)驗(yàn)管理
- 構(gòu)建高質(zhì)量訓(xùn)練數(shù)據(jù)集,設(shè)計(jì)數(shù)據(jù)清洗、標(biāo)注及合成方案,確保數(shù)據(jù)質(zhì)量與多
樣性。
- 設(shè)計(jì)實(shí)驗(yàn)方案并復(fù)現(xiàn)前沿模型,通過對比實(shí)驗(yàn)驗(yàn)證技術(shù)路線可行性。
3. 技術(shù)落地支持
- 協(xié)同團(tuán)隊(duì)完成模型部署與調(diào)優(yōu),優(yōu)化推理延遲與吞吐量,支持端側(cè)/云端多場景 應(yīng)用。
- 輸出技術(shù)文檔與專利,推動研究成果在智能數(shù)據(jù)治理、知識治理、文本挖掘、
人機(jī)交互等領(lǐng)域的商業(yè)化落地。
任職要求:
1. 教育背景
- 計(jì)算機(jī)科學(xué)、人工智能或相關(guān)專業(yè)碩士及以上學(xué)歷,有扎實(shí)的數(shù)學(xué)與算法基
礎(chǔ)。
2. 技術(shù)能力
- 精通PyTorch/TensorFlow等框架,熟悉DeepSpeed、LlamaFactory等分布式訓(xùn)練 工具,掌握模型并行、流水線并行等優(yōu)化技術(shù)。
- 具備強(qiáng)化學(xué)習(xí)研究經(jīng)驗(yàn),有頂會論文或開源項(xiàng)目貢獻(xiàn)者優(yōu)先。
3. 工程實(shí)踐
- 熟悉Linux系統(tǒng)與Docker或K8s,具備大規(guī)模數(shù)據(jù)處理與模型調(diào)優(yōu)經(jīng)驗(yàn),能獨(dú)立解決GPU集群、網(wǎng)絡(luò)通信等工程問題。
4. 加分項(xiàng)
- 有數(shù)據(jù)治理、等垂直領(lǐng)域模型落地經(jīng)驗(yàn)者優(yōu)先。
- 熟悉模型可解釋性分析或自動化評測工具(如BLEU、ROUGE)優(yōu)先。