用工形式:人力服務(wù)外包
崗位要求:
1、負(fù)責(zé)構(gòu)建和完善大模型的評(píng)測(cè)基準(zhǔn),設(shè)計(jì)評(píng)測(cè)維度和方法,并跟蹤業(yè)界前沿技術(shù)保持評(píng)測(cè)體系的先進(jìn)性;
2、開發(fā)和維護(hù)自動(dòng)化評(píng)測(cè)框架與工具鏈,提升模型迭代效率;
3、執(zhí)行模型評(píng)測(cè)并深入分析結(jié)果,通過量化分析定位模型能力的短板和瓶頸,撰寫評(píng)測(cè)報(bào)告,為微調(diào)團(tuán)隊(duì)提供改進(jìn)建議,推動(dòng)模型能力提升。
崗位職責(zé):
1. 具有良好的溝通協(xié)調(diào)能力、邏輯思維能力和學(xué)習(xí)能力;
2、2年以上工作經(jīng)驗(yàn),熟練掌握Python編程及PyTorch等深度學(xué)習(xí)框架;
3、了解大模型基本原理和評(píng)測(cè)方法,能夠獨(dú)立構(gòu)建評(píng)測(cè)集,設(shè)計(jì)科學(xué)的評(píng)測(cè)方案。