崗位職責:
1.負責大規(guī)模分布式深度學習平臺技術研發(fā),主要包括分布式訓練方案設計與實現(xiàn)、分布式訓練任務資源調(diào)度、計量與性能優(yōu)化;
2.負責深度學習相關前瞻技術的跟蹤調(diào)研和升級迭代,包括GPU等計算資源虛擬化、算法框架、AutoML、模型壓縮等技術和理論的調(diào)研及研究工作;
3.深入主流深度學習框架,針對移動現(xiàn)有模型訓練與推理業(yè)務,進行性能優(yōu)化、定制開發(fā);
4.從軟硬件協(xié)同的角度,研究異構芯片、云邊端場景下的深度學習平臺關鍵技術及難點問題。
任職要求:
需求專業(yè):計算機科學與技術、軟件工程、通信工程或其他相關專業(yè)。
技能要求:
1.熟悉容器技術,具有Docker、Kubernetes開發(fā)或使用經(jīng)驗;
2.熟練使用Python/Shell/Golang或其他語言,要求編成風格良好,具有復雜業(yè)務邏輯的編寫經(jīng)驗;
3.了解深度學習技術相關框架及算法,有Tensorflow/Pytorch/Caffe等主流框架使用經(jīng)驗優(yōu)先;
4.有分布式訓練經(jīng)驗,對Jupyter、CUDA等技術有了解的優(yōu)先;
5.有分布式計算、AutoML、模型壓縮等研究經(jīng)驗優(yōu)先。
素質(zhì)要求:
1.有責任心,工作熱情、耐心、踏實、嚴謹,有團隊合作精神;
2.出色的溝通能力,喜歡自我驅(qū)動的工作;
3.具備較強的動手實踐能力;
4.具備一定的抗壓能力,有能力應對來自工作上的各種壓力。