崗位職責(zé):
1.熟悉inux、windows等操作系統(tǒng),有系統(tǒng)底層調(diào)優(yōu)經(jīng)驗(yàn)。
2.利用批量部署工具(如 Ansible)實(shí)現(xiàn)服務(wù)器、中間件的自動(dòng)化部署。
3.負(fù)責(zé) Docker 容器與 K8s 集群的搭建、管理及故障排查。
4.通過(guò)開(kāi)源監(jiān)控工具(如 Prometheus、grafana)監(jiān)控系統(tǒng)指標(biāo),及時(shí)處理異常。
5.排查 Linux、中間件、容器及 AI 工具的運(yùn)行故障并優(yōu)化性能。
6.進(jìn)行系統(tǒng)安全加固、漏洞修復(fù),確保合規(guī)性。
7.跟蹤開(kāi)源技術(shù)動(dòng)態(tài),推動(dòng)新技術(shù)(如 AI 工具)落地與團(tuán)隊(duì)分享。
崗位要求:
1.本科及以上學(xué)歷,計(jì)算機(jī)相關(guān)專(zhuān)業(yè),5 年以上 Linux 系統(tǒng)運(yùn)維經(jīng)驗(yàn)。
2.精通 Linux 系統(tǒng)(CentOS/Ubuntu)配置、調(diào)優(yōu)及命令行操作。
3.熟悉開(kāi)源中間件(Nginx/Redis/Kafka 等)的部署與優(yōu)化。
4.掌握 Docker 鏡像構(gòu)建、K8s 集群管理及核心資源配置。
5.熟練使用至少一種開(kāi)源監(jiān)控工具(Prometheus/Zabbix)和批量部署工具。
6.了解 AI 開(kāi)源工具(TensorFlow/PyTorch)的基本架構(gòu)及環(huán)境搭建。
7.具備強(qiáng)故障排查能力、學(xué)習(xí)能力及團(tuán)隊(duì)協(xié)作精神。