注意:需接受派駐廣西地區(qū)項(xiàng)目或長期出差廣西地區(qū)項(xiàng)目
一、核心職責(zé)概述
負(fù)責(zé)企業(yè)IT基礎(chǔ)設(shè)施和應(yīng)用系統(tǒng)的全生命周期管理,涵蓋容器化部署、自動化運(yùn)維、服務(wù)監(jiān)控、安全合規(guī)、資源規(guī)劃等領(lǐng)域,保障系統(tǒng)高可用性、安全性及穩(wěn)定性。
二、具體職責(zé)范圍1. 應(yīng)用部署與維護(hù)
負(fù)責(zé)在容器集群(Kubernetes、天翼云容器服務(wù))?、虛擬機(jī)(VMware/OpenStack)、物理機(jī)等環(huán)境中部署、升級和回滾應(yīng)用系統(tǒng)。
設(shè)計(jì)容器化部署方案,優(yōu)化鏡像構(gòu)建流程(Dockerfile編寫、Harbor鏡像倉庫管理)。
配合開發(fā)團(tuán)隊(duì)完成應(yīng)用環(huán)境適配,解決跨平臺部署兼容性問題。
2. 持續(xù)集成與持續(xù)交付(CI/CD)?
在Jenkins中設(shè)計(jì)和維護(hù)自動化部署流水線(Job配置),支持Java(Maven構(gòu)建)、Node.js等語言的項(xiàng)目構(gòu)建與發(fā)布。
集成代碼倉庫(GitLab)、制品庫(Nexus)、鏡像倉庫(Harbor)等工具鏈,實(shí)現(xiàn)代碼提交到生產(chǎn)環(huán)境的全流程自動化。
優(yōu)化CI/CD流程,提升部署效率,保障發(fā)布過程的穩(wěn)定性。
3. 中間件與工具鏈運(yùn)維
運(yùn)維以下核心工具及服務(wù):
?容器生態(tài):Docker、Harbor(鏡像倉庫)
?開發(fā)協(xié)作:GitLab(代碼倉庫)、Nexus(制品庫)、Minio(對象存儲)
?數(shù)據(jù)庫與中間件:MySQL、Redis、MongoDB、ELK(日志分析)、RabbitMQ/ActiveMQ(消息隊(duì)列)
?微服務(wù)組件:Nacos(服務(wù)注冊發(fā)現(xiàn))、Keepalived(高可用)、Sentinel(流量控制)、SkyWalking(APM)
負(fù)責(zé)安裝、配置、監(jiān)控、擴(kuò)容、故障排查及版本升級,保障服務(wù)可用性。
4. 監(jiān)控與告警體系建設(shè)
基于Prometheus搭建指標(biāo)監(jiān)控系統(tǒng),通過Grafana實(shí)現(xiàn)可視化看板配置。
監(jiān)控容器集群、微服務(wù)、中間件的性能指標(biāo)(CPU/內(nèi)存/網(wǎng)絡(luò))、業(yè)務(wù)健康狀態(tài)(API成功率、延遲)。
配置告警規(guī)則(如Prometheus ************),聯(lián)動企業(yè)微信/釘釘/Slack等通知渠道,實(shí)現(xiàn)異常實(shí)時響應(yīng)。
5. 安全合規(guī)與漏洞管理
配合等保測評要求,完成服務(wù)器安全基線配置(SSH加固、權(quán)限最小化)、漏洞修復(fù)(如操作系統(tǒng)補(bǔ)丁、軟件版本升級)。
定期執(zhí)行安全掃描(如Nessus、OpenVAS),修復(fù)高風(fēng)險(xiǎn)漏洞(如Log4j、Fastjson漏洞)。
制定安全加固方案,例如數(shù)據(jù)庫訪問控制、敏感數(shù)據(jù)加密(Minio TLS配置)、防火墻策略優(yōu)化。
6. 基礎(chǔ)設(shè)施規(guī)劃與優(yōu)化
參與硬件資源規(guī)劃,評估服務(wù)器、存儲、網(wǎng)絡(luò)資源需求,設(shè)計(jì)高可用架構(gòu)(如Kubernetes多節(jié)點(diǎn)集群、數(shù)據(jù)庫主從復(fù)制)。
優(yōu)化云資源使用(如天翼云資源配額管理),配合網(wǎng)絡(luò)團(tuán)隊(duì)完成VPC、負(fù)載均衡、防火墻規(guī)則設(shè)計(jì)。
推動容器化遷移與資源利用率提升(如HPA自動擴(kuò)縮容)。
7. 文檔與協(xié)作支持
編寫運(yùn)維操作手冊、故障處理預(yù)案、系統(tǒng)架構(gòu)圖。
協(xié)助開發(fā)團(tuán)隊(duì)定位線上問題(如通過SkyWalking分析鏈路異常)。
參與跨部門協(xié)作,如配合架構(gòu)師完成微服務(wù)治理方案設(shè)計(jì)。
三、附加能力要求
?技術(shù)棧深度:熟悉Linux系統(tǒng)管理、Shell/Python腳本編寫,了解微服務(wù)架構(gòu)(Spring Cloud/Alibaba)。
?問題導(dǎo)向:具備快速定位故障能力(如通過ELK分析日志、通過Redis慢查詢定位性能瓶頸)。
?安全意識:熟悉等保2.0標(biāo)準(zhǔn),掌握常見漏洞修復(fù)方法(如CVE漏洞處理)。
?工具整合能力:能將分散的工具(如Prometheus+************+Grafana)整合為統(tǒng)一監(jiān)控平臺。
四、工作目標(biāo)
?穩(wěn)定性:保障系統(tǒng)全年可用率≥99.95%,平均故障恢復(fù)時間(MTTR)≤30分鐘。
?自動化:實(shí)現(xiàn)90%以上的日常操作自動化(如日志清理、備份、巡檢)。
?成本優(yōu)化:通過資源調(diào)度策略(如K8s彈性伸縮)降低云資源成本10%-20%。
?安全合規(guī):通過等保測評并持續(xù)滿足合規(guī)要求