崗位職責(zé):
建設(shè)統(tǒng)一可觀測(cè)性體系,包括監(jiān)控、日志、鏈路追蹤、APM
設(shè)計(jì)和實(shí)施SLI/SLO指標(biāo)體系,建立業(yè)務(wù)健康度量標(biāo)準(zhǔn)
開(kāi)發(fā)智能運(yùn)維工具,包括異常檢測(cè)、故障預(yù)測(cè)、根因分析
負(fù)責(zé)多云監(jiān)控?cái)?shù)據(jù)集成和可視化展示
實(shí)施告警優(yōu)化和智能降噪,提升故障發(fā)現(xiàn)效率
任職要求:
本科及以上學(xué)歷,計(jì)算機(jī)相關(guān)專(zhuān)業(yè),3-5年監(jiān)控或可觀測(cè)性經(jīng)驗(yàn)
精通Prometheus、Grafana、ELK、Jaeger等可觀測(cè)性工具棧
具備強(qiáng)大的腳本開(kāi)發(fā)能力,熟悉Python、Go、Shell等
熟悉時(shí)序數(shù)據(jù)庫(kù)和大數(shù)據(jù)處理技術(shù)
具備數(shù)據(jù)分析和機(jī)器學(xué)習(xí)基礎(chǔ)知識(shí)
良好的數(shù)據(jù)可視化和報(bào)表開(kāi)發(fā)能力
Onsite易點(diǎn)天下,外企七險(xiǎn)一金,15天年假,試用期100%薪資