職位描述:
1. 負(fù)責(zé)產(chǎn)品的功能測試、性能測試、自動化測試等工作,涵蓋大模型服務(wù)、數(shù)據(jù)平臺等。
2. 制定迭代版本驗(yàn)收標(biāo)準(zhǔn)及對應(yīng)測試計(jì)劃,設(shè)計(jì)和執(zhí)行大模型落地產(chǎn)品的測試集及測試用例,評估系統(tǒng)的功能、性能和準(zhǔn)確性。
3. 分析測試結(jié)果,發(fā)現(xiàn)和報(bào)告問題,推動系統(tǒng)的改進(jìn)和優(yōu)化。
4. 與其他團(tuán)隊(duì)成員協(xié)作,推動項(xiàng)目的進(jìn)展,確保模型的質(zhì)量和可靠性。
5. 撰寫測試報(bào)告,記錄測試結(jié)果和問題,評估其合理性、準(zhǔn)確性、場景匹配度,為團(tuán)隊(duì)提供有價(jià)值的反饋。
6. 協(xié)助設(shè)計(jì)新的測試場景或任務(wù)流程,用于模型能力的覆蓋性評估。
職位要求:
1. 計(jì)算機(jī)科學(xué)、軟件工程、人工智能等相關(guān)專業(yè)本科及以上學(xué)歷。
2. 5年以上軟件測試經(jīng)驗(yàn),2年以上AI/大模型測試經(jīng)驗(yàn)。
3. 熟悉NLP、深度學(xué)習(xí)模型的測試方法與評測指標(biāo)。
4. 熟練掌握Python編程語言,精通Pytest、unittest等測試框架。
5. 有良好的邏輯思維和問題分析能力,善于總結(jié)行為模式或失敗原因;
6. 以下至少有一項(xiàng)需要滿足:(最好至少滿足大模型測試方向)
加分項(xiàng):有LLM大模型相關(guān)項(xiàng)目經(jīng)歷
加分項(xiàng):有0-1負(fù)責(zé)新項(xiàng)目經(jīng)歷或小組管理經(jīng)驗(yàn)
加分項(xiàng):全鏈路性能測試方案設(shè)計(jì)、執(zhí)行能力
加分項(xiàng):有提效平臺搭建能力