【崗位職責】
1.參與人工智能相關(guān)算法開發(fā),包括大語言模型預訓練、全參數(shù)微調(diào)與高效參數(shù)微調(diào)訓練(如Lora、P-tuning等)、PPO/DPO等強化學習訓練;多模態(tài)大模型預訓練,深入理解多模態(tài)對齊融合機理,進行Qformer或mlp對齊實驗。
2.參與數(shù)據(jù)合成工作,包括SD圖像生成,深入理解擴散模型底層原理,有文生圖模型預訓練經(jīng)驗。
3.負責進行前沿強化學習實驗,深入理解思維鏈、獎勵黑客等原理。
4.參與大模型訓練框架優(yōu)化,熟練掌握Megatron,deepspeed等訓練框架,運用并調(diào)優(yōu)數(shù)據(jù)并行、張量并行、流水線并行等多維度并行策略。
5. 參與大模型智能體開發(fā)、RAG開發(fā)優(yōu)化、自然語言處理、計算機視覺等項目;
6.參與業(yè)務場景調(diào)研,進行具體算法優(yōu)化及效果驗證;
7.參與模型推理部署,低精度量化等工作,與產(chǎn)品、后端配合,將算法封裝成服務,供用戶調(diào)用。
【任職要求】
1.擁有人工智能、大數(shù)據(jù)、數(shù)學、計算機科學與技術(shù)、軟件工程、電子信息等相關(guān)專業(yè)本科及以上學歷。擁有人工智能相關(guān)工作經(jīng)驗5年及以上。
2.具備在大型科技公司或互聯(lián)網(wǎng)公司從業(yè)經(jīng)驗,對算法有深刻理解,精通人工智能相關(guān)技術(shù),包括但不限于機器學習,深度學習,自然語言處理、計算機視覺、大語言模型、多模態(tài)大模型、數(shù)字人等。
3.掌握Transformer基本原理,精通NLP、AIGC、語音識別等算法,熟悉知名開源大模型(如Llama、chatGLM、百川、Qwen等)設計流程優(yōu)先。
4.具備大模型應用開發(fā)經(jīng)驗,有RAG/NL2SQL/Agent等模塊開發(fā)與應用落地經(jīng)驗。
5.精通大模型的分布式系統(tǒng)和多GPU優(yōu)化。
6.熟練掌握python等編程語言,熟悉模型微調(diào)、推理部署、輕量化開發(fā)等流程,
7.熟練掌握Pytorch、Tensorflow等深度學習訓練框架,具有一定強化學習應用經(jīng)驗。
8.具有較強的業(yè)務學習能力,能夠?qū)碗s行業(yè)場景進行問題梳理,細化開發(fā)流程。
9.有較強的抗壓能力,能夠完成領(lǐng)導安排的其他工作。