崗位職責(zé):
1. 研究強(qiáng)化學(xué)習(xí)以及類強(qiáng)化學(xué)習(xí)技術(shù),構(gòu)造偏好數(shù)據(jù)、訓(xùn)練大模型、設(shè)計(jì)新架構(gòu)。
2. 數(shù)據(jù)構(gòu)造及標(biāo)注管理
3. 完成大模型強(qiáng)化學(xué)習(xí)領(lǐng)域科技成果,包括但不限于論文和專利。
任職資格:
1. 人工智能、計(jì)算機(jī)、電子工程、自動(dòng)化、數(shù)學(xué)、物理等相關(guān)專業(yè)畢業(yè),獲得碩士和博士學(xué)歷,以及優(yōu)秀本科畢業(yè)生。
2. 對(duì)以下方向中的至少其中一個(gè)有研究或項(xiàng)目經(jīng)驗(yàn):大模型、自然語(yǔ)言處理、深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)。熟悉分布式訓(xùn)練框架,如Megatron-LM和DeepSpeed,并具備多機(jī)多卡大模型訓(xùn)練經(jīng)驗(yàn)者優(yōu)先考慮。
3. 優(yōu)秀的編程能力,ACM/ICPC、IOI等編程競(jìng)賽獲獎(jiǎng)?wù)邇?yōu)先。
4. 具有良好的英語(yǔ)讀寫能力,可以完成英文論文寫作。
5. 有高質(zhì)量論文發(fā)表者優(yōu)先 (如NIPS, ICLR, ACL, CVPR, ICCV, ECCV等),有較強(qiáng)學(xué)術(shù)比賽經(jīng)驗(yàn)者,有在開源社區(qū)有較大影響力者優(yōu)先。
6. 理論基礎(chǔ)扎實(shí),有創(chuàng)新精神和深入思考能力。