1. 負責模型測試平臺的開發(fā)和維護,深入理解語言、多模態(tài)大模型的原理及應(yīng)用場景,設(shè)計算法評測方案,參與編寫并執(zhí)行算法評測工作,對算法的準確性、安全性等方面進行評估,撰寫評測報告。
2.負責問題跟蹤,與開發(fā)團隊、產(chǎn)品團隊緊密協(xié)作,及時反饋測試中發(fā)現(xiàn)的問題,清晰闡述問題現(xiàn)象、復現(xiàn)步驟和影響范圍,協(xié)助定位和解決問題。
3. 負責自動化分析平臺工具的開發(fā)和維護,使用專業(yè)工具或自建工具模擬高并發(fā)場景,測試大模型在不同負載下的響應(yīng)速度、吞吐量等性能指標,分析測試結(jié)果,產(chǎn)出測試報告。
4. 負責測試資產(chǎn)的整理與維護,包括迭代測試方案、構(gòu)造測試數(shù)據(jù)集、歸檔測試報告等。
1. 本科及以上學歷,計算機、人工智能、自動化等相關(guān)專業(yè);
2. 3年以上工作經(jīng)驗,有大模型開發(fā)、測試或問題分析經(jīng)驗,對數(shù)據(jù)敏感;
3. 熟練使用python或Java,有相關(guān)開發(fā)經(jīng)驗者優(yōu)先
4. 良好的溝通協(xié)調(diào)能力,團隊合作能力和問題解決能力;
5. 熱愛基座模型行業(yè),勤奮積極,思維清晰,細致沉穩(wěn)、溝通能力強;