(此崗位為外包崗位)
崗位職責(zé):
1.熟悉業(yè)界主流框架的部署與集成,完成在自研異構(gòu)芯片上的接入調(diào)試;
2.負(fù)責(zé)自研AI框架(含訓(xùn)練/推理引擎)的架構(gòu)設(shè)計(jì)、核心模塊開(kāi)發(fā)及性能調(diào)優(yōu);
3.熟悉分布式并行基礎(chǔ)原理,配合軟硬件進(jìn)行分布式訓(xùn)練推理策略的制定;
4.主導(dǎo)AI框架與自研芯片(GPU/NPU等)的軟硬件協(xié)同設(shè)計(jì),通過(guò)編譯器優(yōu)化(如圖優(yōu)化、算子融合、內(nèi)存調(diào)度)提升計(jì)算效率。
崗位要求:
1.具備框架開(kāi)發(fā)相關(guān)工作經(jīng)驗(yàn),從事過(guò)AI框架研發(fā)項(xiàng)目者優(yōu)先;
2.深入了解主流大模型知識(shí)以及分布式訓(xùn)推技術(shù)((Megatron-LM、DeepSpeed));
3.了解AI編譯器技術(shù)棧(MLIR/LLVM),掌握?qǐng)D優(yōu)化、算子融合、多面體優(yōu)化等編譯加速方法優(yōu)先;
4.有異構(gòu)芯片(GPU/NPU)開(kāi)發(fā)經(jīng)驗(yàn):熟悉CUDA/OpenCL編程優(yōu)先;
5.有良好的學(xué)習(xí)能力、溝通能力和團(tuán)隊(duì)合作能力,工作態(tài)度端。