IT基礎架構設計專家
1.8-2.5萬元/月主要職責:
#1. 基礎架構設計與管理
- 負責華為AI服務器(如昇騰/鯤鵬系列)的硬件規(guī)劃、部署與性能調優(yōu),保障計算、存儲及網(wǎng)絡資源的科學配置。
- 構建并維護基于OKD/OpenShift的Kubernetes集群,優(yōu)化容器化應用(如MOM/QMS系統(tǒng))的調度與編排機制。
- 規(guī)劃混合云環(huán)境(華為云+私有云)下的網(wǎng)絡架構,實現(xiàn)跨區(qū)域(中國、越南及其他海外站點)數(shù)據(jù)高效同步與低延遲訪問。
#2. 企業(yè)IT核心系統(tǒng)運維
- 運維企業(yè)郵箱平臺(如Exchange/華為云企業(yè)郵箱),確保服務高可用,并實施反垃圾郵件與安全防護策略。
- 優(yōu)化全球網(wǎng)絡結構(SD-WAN/VPN/MPLS),保障工廠、研發(fā)部門與云端之間的穩(wěn)定通信。
- 部署并管理DNS/DHCP/NTP/LDAP等基礎服務,統(tǒng)一身份認證體系與訪問權限控制(如華為IAM或微軟AD)。
#3. AI基礎設施與高性能計算支持
- 規(guī)劃GPU/NPU服務器集群(如華為Atlas系列),支撐AI訓練、推理及邊緣計算業(yè)務場景。
- 設計分布式存儲方案(如Ceph/華為OceanStor)與高速互聯(lián)網(wǎng)絡(如InfiniBand/RoCE),提升AI與大數(shù)據(jù)任務處理效率。
- 協(xié)同算法團隊,確保底層算力資源與主流框架(如TensorFlow/PyTorch)良好兼容與高效利用。
#4. 安全與自動化運維
- 推行基礎設施即代碼(IaC)實踐(Terraform/Ansible),實現(xiàn)服務器、網(wǎng)絡及K8s資源的自動化部署與管理。
- 構建多層次安全防護體系,涵蓋防火墻規(guī)則、零信任網(wǎng)絡(ZTNA)、數(shù)據(jù)加密及漏洞修復機制。
- 搭建監(jiān)控告警平臺(Prometheus+ELK+Grafana),全面覆蓋硬件狀態(tài)、容器運行、網(wǎng)絡性能及AI算力指標。
任職要求:
核心技能:
- 具備5年以上企業(yè)級IT基礎設施架構經(jīng)驗,熟悉華為服務器(鯤鵬/昇騰)及相關OKD/OpenShift技術生態(tài)。
- 精通Kubernetes集群運維,擁有大規(guī)模生產(chǎn)環(huán)境下的性能優(yōu)化經(jīng)驗(如節(jié)點調度策略、存儲CSI插件定制開發(fā))。
- 掌握企業(yè)級網(wǎng)絡技術(BGP/VXLAN/SD-WAN)及核心IT服務(郵箱/DNS/AD/LDAP)的整體架構設計方法。
- 擁有AI計算平臺運維背景(如GPU/NPU集群、Kubeflow/MLOps),了解高速網(wǎng)絡與存儲系統(tǒng)的調優(yōu)方案。
- 熟練運用自動化工具鏈(Terraform/Ansible/Jenkins)及監(jiān)控平臺(Prometheus/Zabbix)進行日常運維管理。