職位描述:
1. 負(fù)責(zé)產(chǎn)品的功能測(cè)試、性能測(cè)試、自動(dòng)化測(cè)試等工作,涵蓋大模型服務(wù)、數(shù)據(jù)平臺(tái)等。
2. 制定迭代版本驗(yàn)收標(biāo)準(zhǔn)及對(duì)應(yīng)測(cè)試計(jì)劃,設(shè)計(jì)和執(zhí)行大模型落地產(chǎn)品的測(cè)試集及測(cè)試用例,評(píng)估系統(tǒng)的功能、性能和準(zhǔn)確性。
3. 分析測(cè)試結(jié)果,發(fā)現(xiàn)和報(bào)告問(wèn)題,推動(dòng)系統(tǒng)的改進(jìn)和優(yōu)化。
4. 與其他團(tuán)隊(duì)成員協(xié)作,推動(dòng)項(xiàng)目的進(jìn)展,確保模型的質(zhì)量和可靠性。
5. 撰寫測(cè)試報(bào)告,記錄測(cè)試結(jié)果和問(wèn)題,評(píng)估其合理性、準(zhǔn)確性、場(chǎng)景匹配度,為團(tuán)隊(duì)提供有價(jià)值的反饋。
6. 協(xié)助設(shè)計(jì)新的測(cè)試場(chǎng)景或任務(wù)流程,用于模型能力的覆蓋性評(píng)估。
職位要求:
1. 計(jì)算機(jī)科學(xué)、軟件工程、人工智能等相關(guān)專業(yè)本科及以上學(xué)歷。
2. 5年以上軟件測(cè)試經(jīng)驗(yàn),2年以上AI/大模型測(cè)試經(jīng)驗(yàn)。
3. 熟悉NLP、深度學(xué)習(xí)模型的測(cè)試方法與評(píng)測(cè)指標(biāo)。
4. 熟練掌握Python編程語(yǔ)言,精通Pytest、unittest等測(cè)試框架。
5. 有良好的邏輯思維和問(wèn)題分析能力,善于總結(jié)行為模式或失敗原因;
6. 以下至少有一項(xiàng)需要滿足:(最好至少滿足大模型測(cè)試方向)
加分項(xiàng):有LLM大模型相關(guān)項(xiàng)目經(jīng)歷
加分項(xiàng):有0-1負(fù)責(zé)新項(xiàng)目經(jīng)歷或小組管理經(jīng)驗(yàn)
加分項(xiàng):全鏈路性能測(cè)試方案設(shè)計(jì)、執(zhí)行能力
加分項(xiàng):有提效平臺(tái)搭建能力