崗位職責(zé):
負(fù)責(zé)SRE團(tuán)隊(duì)技術(shù)方向制定和團(tuán)隊(duì)管理,推動(dòng)穩(wěn)定性工程最佳實(shí)踐落地
設(shè)計(jì)和優(yōu)化多云環(huán)境下的系統(tǒng)架構(gòu)穩(wěn)定性,制定SLI/SLO體系和錯(cuò)誤預(yù)算管理
主導(dǎo)重大故障應(yīng)急響應(yīng),建立故障處理流程和應(yīng)急預(yù)案
負(fù)責(zé)容災(zāi)體系設(shè)計(jì)和災(zāi)難恢復(fù)演練,確保業(yè)務(wù)連續(xù)性
推動(dòng)跨團(tuán)隊(duì)協(xié)作,建立SRE文化和穩(wěn)定性意識(shí)
任職要求:
本科及以上學(xué)歷,計(jì)算機(jī)相關(guān)專業(yè),5年以上大型互聯(lián)網(wǎng)公司SRE/DevOps經(jīng)驗(yàn)
精通多云架構(gòu)設(shè)計(jì)(AWS、阿里云、GCP、OCI),具備大規(guī)模分布式系統(tǒng)穩(wěn)定性治理經(jīng)驗(yàn)
熟悉Kubernetes、Docker、服務(wù)網(wǎng)格等云原生技術(shù)棧
具備優(yōu)秀的架構(gòu)設(shè)計(jì)能力和容災(zāi)規(guī)劃經(jīng)驗(yàn)
優(yōu)秀的團(tuán)隊(duì)管理和跨部門協(xié)作能力
英語讀寫能力良好,能閱讀英文技術(shù)文檔
Onsite易點(diǎn)天下,外企七險(xiǎn)一金,15天年假,試用期100%薪資