職位描述:
 1、為部署在大型數(shù)據(jù)中心、AI實(shí)驗(yàn)室和云服務(wù)商中的高端計(jì)算硬件(如NVIDIA H系列、A系列,或國(guó)產(chǎn)算力卡)提供技術(shù)支持;
 2、需解決從硬件故障、驅(qū)動(dòng)兼容性到大規(guī)模集群性能調(diào)優(yōu)的全棧技術(shù)挑戰(zhàn),確??蛻鬉I業(yè)務(wù)和科學(xué)計(jì)算的穩(wěn)定與高效運(yùn)行;
 主要職責(zé):
 1、現(xiàn)場(chǎng)技術(shù)支持,負(fù)責(zé)GPU算力卡及其服務(wù)器(如DGX/HGX系統(tǒng)、自主品牌AI服務(wù)器)的現(xiàn)場(chǎng)部署、上架、調(diào)試及故障診斷(包括硬件更換、固件升級(jí)等);
 2、快速響應(yīng)和解決客戶在GPU驅(qū)動(dòng)、容器環(huán)境、深度學(xué)習(xí)框架和作業(yè)調(diào)度平臺(tái)中遇到的技術(shù)問(wèn)題。
 任職要求:
 1、 計(jì)算機(jī)科學(xué)、電子信息、通信工程或相關(guān)專業(yè)本科及以上學(xué)歷;
 2、深刻理解GPU算力卡(如NVIDIA/AMD/國(guó)產(chǎn)芯片)的硬件架構(gòu),熟悉其供電、散熱和高速互連(NVLink/NVSwitch)特性,具備服務(wù)器硬件級(jí)故障診斷能力;
 3、領(lǐng)會(huì)NVIDIA GPU軟件棧、驅(qū)動(dòng)程序、CUDA Toolkit、cuDNN、TensorRT、NCCL;
 4、熟悉Linux操作系統(tǒng)(特別是Ubuntu/CentOS);
 5、可適應(yīng)出差;
 6、良好的溝通表達(dá)能力;
 工作地點(diǎn):西寧市及其周邊地區(qū)(西寧市湟中區(qū)錦川大道200號(hào)中國(guó)聯(lián)通三江源綠電智算融合示范園)
 職位福利:五險(xiǎn)一金、帶薪年假、員工旅游、節(jié)日福利、年終獎(jiǎng) 。