一、崗位職責: 1、全面運維管理 v 負責算力中心基礎設施的日常運維,包括電力系統(tǒng)、制冷系統(tǒng)、網(wǎng)絡設備、服務器集群等,確保99.99%以上的可用性; v 組織部門工作,制定運維工作流程與制度,保證算力中心工作的正常進行,滿足算力中心安全運營的要求,優(yōu)化資源調(diào)度與能效管理(PUE≤1.2); v 保證供電正常和設備廠商技術支持,其它支持工作項及時到位。 2、安全與應急響應 v 主導機房安全體系建設,落實消防、安防、數(shù)據(jù)安全規(guī)范,制定應急預案并定期演練; v 處理突發(fā)電力中斷、設備故障、網(wǎng)絡攻擊等事件,確保業(yè)務連續(xù)性。 3、團隊與技術管理 v 領導運維團隊(含電力、網(wǎng)絡、硬件工程師),制定培訓計劃,提升團隊技能; v 關注各系統(tǒng)的設計、設備的最新成果,并結合實際工作對現(xiàn)有系統(tǒng)、設備進行優(yōu)化、升級、改造 4、成本與合規(guī)管控 v 根據(jù)業(yè)務目標分析設施運營狀況,優(yōu)化算力中心運行成本,協(xié)調(diào)供應商進行設備維護與升級; v 確保符合國家及行業(yè)標準(如GB 50174),通過第三方合規(guī)審計。 二、任職要求 1、專業(yè)背景 v 本科及以上學歷,電氣工程、計算機科學、通信工程、自動化等相關專業(yè);持有CCNA、CDCP、Uptime認證者優(yōu)先。 2、經(jīng)驗要求 v 5年以上IDC運維經(jīng)驗,其中至少3年管理崗位經(jīng)驗,主導過大型數(shù)據(jù)中心(≥1000機柜)運維項目; v 掌握數(shù)據(jù)中心電氣、暖通、弱電、消防系統(tǒng)的基本架構、原理、特性、操作、維護保養(yǎng)要點。 v 具備數(shù)據(jù)中心工程驗收、承載測試、系統(tǒng)優(yōu)化的工作經(jīng)驗。 3、核心能力 v 精通數(shù)據(jù)中心能效優(yōu)化、故障根因分析(RCA)及SLA管理; v 具備較強的風險預判與應急決策能力,能快速處理復雜技術問題; v 具備各系統(tǒng)運維、變更方案、作業(yè)指導書、規(guī)范、流程、制度、測試演練方案、應急預案等文檔的編寫和審核能力。 4、軟性素質(zhì) v 責任心強,良好的口頭與書面溝通、表達能力,具備團隊協(xié)作精神與跨部門溝通能力; v 每周駐場不少于5天,適應7×24小時輪班制及緊急情況現(xiàn)場支援。