崗位職責(zé)
1、系統(tǒng)穩(wěn)定性保障:負(fù)責(zé)保障公司系統(tǒng)、應(yīng)用和服務(wù)的高可用性、可靠性和性能。設(shè)計(jì)、實(shí)施和維護(hù)監(jiān)控系統(tǒng),及時(shí)發(fā)現(xiàn)并解決潛在問(wèn)題。
2、故障排除與問(wèn)題解決:快速響應(yīng)和解決生產(chǎn)環(huán)境中的故障,確保系統(tǒng)正常運(yùn)行。
3、自動(dòng)化運(yùn)維:開(kāi)發(fā)和維護(hù)自動(dòng)化工具,提高系統(tǒng)部署、配置和監(jiān)控的效率。
4、容量規(guī)劃與性能優(yōu)化:分析系統(tǒng)資源使用情況,進(jìn)行容量規(guī)劃,確保系統(tǒng)能夠滿足業(yè)務(wù)增長(zhǎng)需求。
5、安全性保障:與安全團(tuán)隊(duì)合作,確保系統(tǒng)和服務(wù)的安全性,及時(shí)修復(fù)潛在的安全漏洞。
3、能夠深入了解監(jiān)控發(fā)現(xiàn)、故障應(yīng)急、風(fēng)險(xiǎn)治理等一個(gè)或多個(gè)技術(shù)領(lǐng)域,并對(duì)相關(guān)的技術(shù)領(lǐng)域,并將相關(guān)能力平臺(tái)化擴(kuò)展與多場(chǎng)景復(fù)制,解決實(shí)際穩(wěn)定性場(chǎng)景中面臨的問(wèn)題,提升用戶體驗(yàn)。
崗位要求
1、碩士及以上學(xué)歷,計(jì)算機(jī)科學(xué)、信息技術(shù)或相關(guān)專業(yè)背景。
2、5年以上系統(tǒng)運(yùn)維、性能優(yōu)化、故障排查等相關(guān)經(jīng)驗(yàn)。
3、熟練使用自動(dòng)化運(yùn)維工具,具備Shell、Python等腳本編程經(jīng)驗(yàn)。
4、深入理解計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)、安全等技術(shù)。
5、深入了解云計(jì)算、容器化技術(shù)(Docker、Kubernetes)。
6、熟悉 Prometheus、Grafana 等監(jiān)控工具,具備可觀測(cè)性系統(tǒng)搭建和維護(hù)經(jīng)驗(yàn)。
7、熟悉 ELK/EFK 等日志系統(tǒng),具備日志收集、分析和查詢的實(shí)戰(zhàn)經(jīng)驗(yàn)。
8、熟悉常用的運(yùn)維工具和技術(shù),例如 Ansible、Jenkins、Git 等。
9、具備強(qiáng)大的故障排除和問(wèn)題解決能力,能夠在高壓環(huán)境下迅速應(yīng)對(duì)。
10、有大型分布式系統(tǒng)的設(shè)計(jì)和維護(hù)經(jīng)驗(yàn)者優(yōu)先。
11、對(duì)新技術(shù)有強(qiáng)烈的學(xué)習(xí)興趣,保持對(duì)行業(yè)最新趨勢(shì)的關(guān)注。