職位名稱:網(wǎng)絡(luò)運維工程師
主要職責(zé):??
1. 傳統(tǒng)網(wǎng)絡(luò)架構(gòu)與運維
- 負責(zé)智算中心核心網(wǎng)絡(luò)及邊緣基礎(chǔ)設(shè)施的規(guī)劃、部署、監(jiān)控與優(yōu)化工作。主導(dǎo)企業(yè)級網(wǎng)絡(luò)架構(gòu)的穩(wěn)定性保障,確保7×24小時高可用性,支持Web服務(wù)、數(shù)據(jù)庫、企業(yè)應(yīng)用等關(guān)鍵業(yè)務(wù)的高效運行
??2. 高性能網(wǎng)絡(luò)架構(gòu)與運維??
- 設(shè)計并運維智算中心核心網(wǎng)絡(luò)(InfiniBand/400G/800G IB網(wǎng)),了解RDMA協(xié)議棧、GPU Direct通信及存儲網(wǎng)絡(luò)(NVMe-oF),支撐AI分布式訓(xùn)練任務(wù)的高吞吐與微秒級延遲需求。
- 開發(fā)網(wǎng)絡(luò)自動化工具(Ansible/Terraform),實現(xiàn)網(wǎng)絡(luò)配置管理、流量調(diào)度與故障自愈,構(gòu)建基于Telemetry的實時監(jiān)控體系(Prometheus/Grafana),快速定位網(wǎng)絡(luò)擁塞及異常流量。
??3. 智能安全防護體系構(gòu)建??
- 了解零信任安全架構(gòu)(ZTA),網(wǎng)絡(luò)微隔離(基于Calico/Cilium)、動態(tài)訪問控制(ABAC)及加密通信(IPSec/TLS 1.3),防御APT攻擊、橫向滲透及數(shù)據(jù)泄露風(fēng)險。
- 主導(dǎo)安全合規(guī)管理(等保2.0/GDPR),制定網(wǎng)絡(luò)安全應(yīng)急預(yù)案,了解滲透測試、漏洞掃描及安全加固,確保智算中心全棧合規(guī)。
??
??任職資格:??
??必備條件:??
- ??學(xué)歷與經(jīng)驗??:網(wǎng)絡(luò)、計算機科學(xué)相關(guān)專業(yè)本科及以上學(xué)歷,1年以上超算/智算中心或大型云服務(wù)商網(wǎng)絡(luò)運維經(jīng)驗。
- ??核心技術(shù)能力??:
- ??網(wǎng)絡(luò)領(lǐng)域??
- 精通主流廠商交換機,路由器,防火墻等網(wǎng)絡(luò)設(shè)備,熟悉網(wǎng)絡(luò)協(xié)議BGP、OSPF、EVPN、MPLS等
- 掌握SDN、VXLAN/EVPN,具備TB級數(shù)據(jù)傳輸優(yōu)化經(jīng)驗。
- ??安全領(lǐng)域??:
- 熟悉傳統(tǒng)防火墻安全規(guī)則,堡壘機安全,零信任架構(gòu)(BeyondCorp)、了解安全攻防技術(shù)及主流安全工具(Metasploit/Nmap/Snort)。
- 具備等保2.0三級以上合規(guī)實施經(jīng)驗,熟悉安全審計日志分析。
- ??編程與工具??:
- 熟練使用Python/Go開發(fā)自動化腳本,掌握Terraform/Ansible實現(xiàn)網(wǎng)絡(luò)與安全策略的代碼化部署。
- 熟練使用Wireshark、tcpdump及ELK Stack進行深度流量分析與威脅狩獵。
??優(yōu)先條件:??
- 精通InfiniBand/Omni-Path架構(gòu)及性能調(diào)優(yōu)(Subnet
Manager/PKey策略),熟悉RoCEv2協(xié)議及擁塞控制算法(DCQCN)。
- 持有CISSP、CISP或CCIE
Security認證,具備國家級攻防演練實戰(zhàn)經(jīng)驗。
- Kubernetes網(wǎng)絡(luò)方案(Calico/Cilium)
- 有大規(guī)模公有云網(wǎng)絡(luò)運維經(jīng)驗
- 善于使用AI工具輔助完成工作。
??我們提供:??
- 接觸InfiniBand Quantum-2、400G/800G IB/ROCE計算存儲等大規(guī)模智算網(wǎng)絡(luò)
- 接觸大規(guī)模智算集群的安全,多租戶隔離等網(wǎng)絡(luò)虛擬化方案的設(shè)計和實施
如果您對此職位感興趣,請?zhí)峤荒暮啔v和求職信進行申請。我們期待您的回音!