崗位職責(zé):
1.設(shè)計(jì)通用型AI軟件架構(gòu),支持多模態(tài)模型(CV/NLP/語音)在嵌入式GPU(如RTX 4090)與集群云環(huán)境中的無縫遷移。
2.GPU服務(wù)器部署與優(yōu)化,搭建基于RTX 4090的AI服務(wù)器集群,配置NVLink/PCIe拓?fù)浣Y(jié)構(gòu),實(shí)現(xiàn)多卡并行計(jì)算(如數(shù)據(jù)并行、模型并行)。
3.Linux系統(tǒng)集成與運(yùn)維,定制Linux內(nèi)核驅(qū)動(dòng)(如Nvidia DKMS),解決RTX 4090與舊版內(nèi)核(如Ubuntu 18.04)的兼容性問題。
4.AI模型加速與落地,使用TensorRT量化模型(FP32→INT8),在RTX 4090上實(shí)現(xiàn)推理速度3倍提升,同時(shí)保持98%+精度。
任職要求:
1.計(jì)算機(jī)科學(xué)、電子工程或相關(guān)領(lǐng)域碩士及以上學(xué)位,3年以上AI軟件架構(gòu)開發(fā)經(jīng)驗(yàn)。
2.主導(dǎo)過至少1個(gè)基于GPU的AI項(xiàng)目(如自動(dòng)駕駛感知系統(tǒng)、大語言模型推理服務(wù))