GPU服務器維修工程師
【崗位職責】
1. 處理常見GPU服務器故障,如 顯卡報錯、NVLink通信異常、電源模塊故障、散熱問題 等。
2. 按技術維修規(guī)范操作,負責主流廠商(包括不限于聯想,浪潮,華三等)GPU服務器的現場硬件檢測、故障診斷及維修,或遠程技術指導。
3. 承擔 GPU 服務器的安裝、調試、上架、升級、改配工作,并完成相應的軟件適配,包括 BIOS / 固件更新、驅動程序安裝與調試等
4. 撰寫維修報告,記錄故障案例,協助團隊優(yōu)化維修流程,提高維修效率,降低返修率。
5. 維護現場客戶關系及滿意度。
【任職要求】
1.計算機、電子工程、通信等相關專業(yè),專科及以上學歷
2.熟悉 NVIDIA/AMD 主流顯卡架構(如 Hopper/Ada Lovelace 等)者優(yōu)先考慮
3.一年以上阿里、字節(jié)客戶處的液冷服務器維修經驗或者GPU服務器維修經驗,熟悉機房服務流程和規(guī)范。
4.熟練使用 Linux 命令行,能夠運用自動化工具(Ansible/Kubernetes 等)進行服務器管理,掌握監(jiān)控平臺(Prometheus 等)的配置與使用;熟悉服務器 BMC 管理(IPMI/RedFish);
5.熟悉集群管理工具(Slurm 等)的操作;
【上班時間】
1.早九晚六
2.雙休
【薪資待遇】
1.綜合薪資8-15k
2.繳納五險一金
【工作地點】
內蒙古自治區(qū)烏蘭察布市集寧區(qū)泉山街道新區(qū)數碼大廈1105