工作職責(zé):
深入分析訓(xùn)練系統(tǒng),定位和解決訓(xùn)練系統(tǒng)各個(gè)層次的性能瓶頸,不斷提升訓(xùn)練效率,打造業(yè)界領(lǐng)先的訓(xùn)練系統(tǒng),推進(jìn)算法的高效迭代。如:
1. 面向AI推理場(chǎng)景的全局KVCache的多級(jí)輕量化存儲(chǔ)計(jì)算,與PD分離相結(jié)合,推動(dòng)整體推理性能提升;
2. 面向AI訓(xùn)推場(chǎng)景的通訊性能提升;
3. 優(yōu)化推理速度、內(nèi)存占用和能耗,支持多種硬件架構(gòu)(GPU、NPU等 )
4. 模型量化, 剪枝, 編譯
5. 申請(qǐng)并承擔(dān)科研任務(wù),發(fā)表高水平研究成果,推動(dòng)項(xiàng)目合作。
任職資格:
1. 計(jì)算機(jī)、電子工程、自動(dòng)控制等專業(yè)博士及以上學(xué)歷;
2. 了解深度學(xué)習(xí)算法基本原理,熟悉CNN/Transformers等主流模型原理與CUDA、MPI、NCCL等相關(guān)底層原理;具有AutoML/模型推理/訓(xùn)練優(yōu)化或AI 相關(guān)大模型/重要項(xiàng)目經(jīng)驗(yàn)者優(yōu)先;熟悉
3. 優(yōu)秀的代碼能力,熟練掌握C/C++或Python/CUDA等編程語(yǔ)言。
薪資:15-40K
工作地點(diǎn):1。廣東省東莞市南城區(qū)寰宇匯金中心9B33層;2.北京市海淀區(qū)知春路23號(hào)量子銀座7層