崗位職責(zé):
1、負(fù)責(zé)公司智算平臺(tái)的功能、性能、安全性測(cè)試,確保平臺(tái)的穩(wěn)定性和高效性;
2、設(shè)計(jì)、編寫(xiě)和執(zhí)行測(cè)試用例,搭建自動(dòng)化測(cè)試框架,提升測(cè)試效率;
3、進(jìn)行系統(tǒng)和接口測(cè)試,分析測(cè)試結(jié)果,編寫(xiě)測(cè)試報(bào)告,并推動(dòng)問(wèn)題修復(fù);
4、參與需求評(píng)審,提供測(cè)試策略和優(yōu)化建議,提升產(chǎn)品質(zhì)量;
5、研究并引入先進(jìn)的測(cè)試技術(shù)和工具,提高測(cè)試覆蓋率和自動(dòng)化程度;
6、監(jiān)控和優(yōu)化智算平臺(tái)的資源使用情況,保障大規(guī)模計(jì)算任務(wù)的穩(wěn)定運(yùn)行。
崗位要求:
1、計(jì)算機(jī)、軟件工程、人工智能或相關(guān)專業(yè)本科及以上學(xué)歷;
2、有AI計(jì)算平臺(tái)、分布式計(jì)算或云計(jì)算測(cè)試經(jīng)驗(yàn)者優(yōu)先;
3、熟悉常見(jiàn)的軟件測(cè)試方法和流程,掌握自動(dòng)化測(cè)試框架(如Selenium、pytest、Cypress, Playwrite等);
4、具備較強(qiáng)的Linux系統(tǒng)操作能力,熟悉Shell、Python或其他腳本語(yǔ)言,能編寫(xiě)自動(dòng)化測(cè)試腳本;
5、了解Docker、Kubernetes等云原生技術(shù),有相關(guān)測(cè)試經(jīng)驗(yàn)者優(yōu)先;
6、熟悉常見(jiàn)的性能測(cè)試工具(如JMeter)及監(jiān)控工具(如Prometheus、Grafana);
7、具備較強(qiáng)的分析和問(wèn)題定位能力,良好的溝通和團(tuán)隊(duì)協(xié)作精神。
加分項(xiàng):
有LLM(大語(yǔ)言模型)推理框架或分布式訓(xùn)練相關(guān)測(cè)試經(jīng)驗(yàn);
了解K8S或其他容器編排系統(tǒng)的測(cè)試方法;
熟悉GPU計(jì)算框架(如CUDA、TensorRT、TPU等)。