崗位職責(zé)
1、負(fù)責(zé)云資源池項(xiàng)目運(yùn)維工具(監(jiān)控、自動(dòng)化、CMDB等模塊)的端到端敏捷交付,制定迭代計(jì)劃(Sprint Backlog),把控需求拆解、任務(wù)分派、進(jìn)度跟蹤(甘特圖/燃盡圖)及風(fēng)險(xiǎn)管理,確保按期高質(zhì)量交付。
2、建立持續(xù)交付流水線67(CI/CD),優(yōu)化開發(fā)-測(cè)試-部署流程,提升工程效能(如代碼交付效率、缺陷密度控制)。
3、管理8-10人跨職能團(tuán)隊(duì)(需求/前后端/運(yùn)維開發(fā)/測(cè)試),動(dòng)態(tài)分配任務(wù),解決資源沖突,組織技術(shù)評(píng)審會(huì)(架構(gòu)設(shè)計(jì)、代碼規(guī)范)、每日站會(huì)及迭代復(fù)盤,推動(dòng)技術(shù)債務(wù)清理與流程改進(jìn)。
4、理解云資源池業(yè)務(wù)場(chǎng)景,將客戶需求轉(zhuǎn)化為技術(shù)方案(如將“自動(dòng)化擴(kuò)容”拆解為可執(zhí)行Story點(diǎn)),管理需求變更并調(diào)整優(yōu)先級(jí)。
5、基于SRE框架定義SLI/SLO/SLA67(如監(jiān)控覆蓋率≥99%、自動(dòng)化腳本執(zhí)行成功率≥99.9%),設(shè)計(jì)錯(cuò)誤預(yù)算(Error Budget)管理機(jī)制,超閾值時(shí)暫停新功能開發(fā)并優(yōu)先修復(fù)。推動(dòng)穩(wěn)定性專項(xiàng)治理67(容災(zāi)設(shè)計(jì)、應(yīng)急預(yù)案、故障演練),實(shí)現(xiàn)“1-5-10”故障響應(yīng)目標(biāo)(1分鐘發(fā)現(xiàn)、5分鐘響應(yīng)、10分鐘恢復(fù))。
崗位要求
1、大專及以上學(xué)歷,計(jì)算機(jī)、軟件工程或相關(guān)專業(yè),5年以上研發(fā)項(xiàng)目管理經(jīng)驗(yàn),至少2年運(yùn)營商云計(jì)算/云資源池相關(guān)項(xiàng)目經(jīng)驗(yàn)。
2、精通敏捷開發(fā)67(Scrum/Kanban)及DevOps工具鏈67(如GitLab CI/Jenkins/Prometheus),持有PMP或CSM認(rèn)證者優(yōu)先。
3、熟悉云原生技術(shù)棧(Kubernetes/Docker)、微服務(wù)架構(gòu)及自動(dòng)化運(yùn)維體系,能評(píng)審技術(shù)方案合理性(如高并發(fā)場(chǎng)景下的緩存設(shè)計(jì))。
4、具備SRE實(shí)踐能力67,包括不限SLI指標(biāo)設(shè)計(jì)、監(jiān)控告警配置、容災(zāi)方案設(shè)計(jì)經(jīng)驗(yàn),熟悉AIOps應(yīng)用者優(yōu)先。
5、優(yōu)秀的客戶溝通與抗壓能力,適應(yīng)快節(jié)奏交付環(huán)境,具備技術(shù)風(fēng)險(xiǎn)預(yù)判及決策能力(如制定功能降級(jí)策略)。
6、出色的跨團(tuán)隊(duì)協(xié)調(diào)能力,能驅(qū)動(dòng)開發(fā)、測(cè)試、運(yùn)維高效協(xié)作,解決接口延遲、數(shù)據(jù)不一致等協(xié)作瓶頸。