崗位描述:
SFT 和RL 數(shù)據(jù)質檢與驗收:對大模型監(jiān)督微調(SFT)、強化學習(RL)任務的數(shù)據(jù)進行全流程質檢,包括數(shù)據(jù)標注的準確性、一致性、合規(guī)性核查,依據(jù)標注規(guī)范和業(yè)務需求,嚴格驗收數(shù)據(jù)質量,保障數(shù)據(jù)符合算法訓練要求。
問題分析與優(yōu)化:深度分析質檢過程中發(fā)現(xiàn)的數(shù)據(jù)問題,如標注錯誤、邏輯矛盾、格式不統(tǒng)一等,提出優(yōu)化建議并推動標注團隊改進;定期總結數(shù)據(jù)質量問題,協(xié)助完善標注規(guī)則和驗收標準。
跨部門協(xié)作:與數(shù)據(jù)標注團隊、算法研發(fā)團隊、產品團隊緊密溝通,及時反饋數(shù)據(jù)質量情況,根據(jù)業(yè)務需求調整質檢策略;參與數(shù)據(jù)標注流程優(yōu)化,為大模型訓練提供高質量數(shù)據(jù)支持。
崗位要求:
專業(yè)知識:熟悉大模型數(shù)據(jù)標注流程,深入了解 SFT、RL 等技術原理及在數(shù)據(jù)標注中的應用,具備扎實的機器學習或自然語言處理理論基礎。
實踐經驗:1 年以上大模型數(shù)據(jù)標注質檢或相關工作經驗,有 SFT、RL 任務數(shù)據(jù)質檢經驗者優(yōu)先;熟練使用常見數(shù)據(jù)質檢工具,能夠高效處理大規(guī)模數(shù)據(jù)。
其他要求:邏輯思維嚴謹,具備較強的問題排查和解決能力;擁有出色的溝通協(xié)調能力,能夠在跨部門協(xié)作中高效推進工作;對人工智能行業(yè)充滿熱情,具備持續(xù)學習新技術的能力。