崗位職責(zé):-
- 評(píng)測(cè)集迭代:根據(jù)項(xiàng)目需求,整理、維護(hù)和迭代評(píng)測(cè)數(shù)據(jù)集,確保數(shù)據(jù)覆蓋全面、場(chǎng)景真實(shí)且可持續(xù)更新。
- 人工評(píng)測(cè)與標(biāo)注:按照既定評(píng)測(cè)規(guī)則,在聊天場(chǎng)景下進(jìn)行多維度人工評(píng)估和打分,確保評(píng)測(cè)結(jié)果準(zhǔn)確可靠,保障數(shù)據(jù)交付的質(zhì)量與進(jìn)度。
- 質(zhì)量管控:統(tǒng)一評(píng)測(cè)標(biāo)準(zhǔn),保證結(jié)果客觀一致;對(duì)已完成標(biāo)注進(jìn)行質(zhì)檢,發(fā)現(xiàn)并修正標(biāo)注錯(cuò)誤,消除歧義,持續(xù)提升評(píng)測(cè)數(shù)據(jù)的可靠性。
- 數(shù)據(jù)分析與報(bào)告產(chǎn)出:對(duì)評(píng)測(cè)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)和分析,總結(jié)模型整體表現(xiàn)、典型問(wèn)題和改進(jìn)建議,產(chǎn)出評(píng)測(cè)報(bào)告。
- 問(wèn)題追蹤與反饋:準(zhǔn)確記錄模型缺陷與異常案例,及時(shí)將問(wèn)題反饋給技術(shù)團(tuán)隊(duì),協(xié)助推動(dòng)問(wèn)題定位與優(yōu)化。
崗位要求:
大專或及以上學(xué)歷,計(jì)算機(jī)、人工智能、語(yǔ)言學(xué)、心理學(xué)等相關(guān)專業(yè)優(yōu)先。
- 對(duì) AI 行業(yè)有深入理解,具備大模型使用經(jīng)驗(yàn)(如 DeepSeek、文心一言、豆包、Kimi、GPT 等),有 AI 數(shù)據(jù)標(biāo)注或者評(píng)測(cè)經(jīng)驗(yàn)優(yōu)先