一、職位描述
1.負責大模型訓練數(shù)據(jù)的構(gòu)建,包括高質(zhì)量數(shù)據(jù)生產(chǎn)、整理和清洗工作;
2.負責模型效果測評,對數(shù)據(jù)正確性提供判斷,對模型生成內(nèi)容正確性提供判斷,對模型進行內(nèi)容改進策略建議;
3.對大模型應用案例和數(shù)據(jù)進行分析,歸納關(guān)鍵性和普遍性問題,提高內(nèi)容優(yōu)質(zhì)率;
4.推動大模型應用方向數(shù)據(jù)標注工作,指導標注人員完成數(shù)據(jù)的高質(zhì)量構(gòu)建,保證按目標及質(zhì)量要求完成結(jié)果產(chǎn)出;
5.對大模型的prompt撰寫有了解,并且能夠根據(jù)應用場景,進行prompt調(diào)優(yōu),驅(qū)動模型達到最優(yōu)效果。
二、職位要求
1.35歲以下,本科及以上學歷,計算機科學、數(shù)據(jù)科學或相關(guān)專業(yè),3年以上相關(guān)工作經(jīng)歷;
2.計算機科學、數(shù)據(jù)科學或相關(guān)領(lǐng)域的本科及以上學歷。
3.熟練掌握至少一種編程語言,如Python,具備良好的編程實踐。
4.有NLP自然語言處理經(jīng)驗者優(yōu)先;了解大模型數(shù)據(jù)要求、大模型訓練過程。
5.熟悉Data-Juicer等大模型數(shù)據(jù)治理開源框架。
6.了解機器學習和數(shù)據(jù)科學原理,有實際項目經(jīng)驗。
7.良好的溝通能力和團隊合作精神,能夠與跨部門團隊緊密協(xié)作,推動項目進展。
8.具有快速學習和適應新技術(shù)的能力,能在動態(tài)環(huán)境中不斷優(yōu)化模型和算法。