任職資格:
1.計算機相關(guān)專業(yè)本科及以上學(xué)歷,至少有5年主流云平臺的建設(shè)、運維相關(guān)經(jīng)驗。
2.精通Linux操作系統(tǒng)和常用組件(Nginx,Tomcat,Elasticsearch,Redis,Kafka等)的部署優(yōu)化,以及故障定位和處理。
3.精通一種以上編程語言,至少掌握python/java/go中的一種編程語言,能自主開發(fā)自動化運維平臺或工具,提高運維效率。
4.熟悉Docker、Mesos、DC/OS、Kubernetes等主流容器技術(shù)的功能及原理,有大規(guī)模集群運維經(jīng)驗。
5.熟悉Ansible、SaltStack、Prometheus、Grafana、Zabbix、Pinpoint、Skywalking等開源運維工具。
6.了解HADOOP集群、PAAS組件,了解SPARK、HIVE、HBASE等技術(shù),掌握SQL基本操作,具備編寫存儲過程的運營研發(fā)能力。
7.具備良好的服務(wù)意識、具備吃苦耐勞精神,能站在分公司一線角度分析、支撐問題。
8.具備運維團隊牽頭或項目管理經(jīng)驗,能夠有效組織協(xié)調(diào)開發(fā)、測試、基礎(chǔ)設(shè)施等多團隊資源,推動運維相關(guān)項目(如自動化平臺建設(shè)、架構(gòu)優(yōu)化、故障復(fù)盤改進、流程標(biāo)準(zhǔn)化等)的規(guī)劃、實施與落地。
9.有主導(dǎo)運維自動化項目、或制定/優(yōu)化運維規(guī)范(如SOP、應(yīng)急預(yù)案、容量規(guī)劃流程)的成功經(jīng)驗,具備技術(shù)方案選型及實施決策能力。
10.具備通信運營商行業(yè)相關(guān)的大數(shù)據(jù)應(yīng)用系統(tǒng)開發(fā)、運維工作經(jīng)驗者優(yōu)先。
崗位職責(zé):
1.負(fù)責(zé)大數(shù)據(jù)項目管理,負(fù)責(zé)基于主流公有云產(chǎn)品的業(yè)務(wù)系統(tǒng)的規(guī)劃、建設(shè)、維護與優(yōu)化,確保業(yè)務(wù)系統(tǒng)的穩(wěn)定性、高可用性和可擴展性。
2.負(fù)責(zé)大數(shù)據(jù)應(yīng)用系統(tǒng)核心架構(gòu)的性能調(diào)優(yōu),定位并修復(fù)系統(tǒng)的疑難問題,負(fù)責(zé)按運維需求完成自動化腳本的開發(fā)。
3.掌握云產(chǎn)品運維過程,針對應(yīng)用系統(tǒng)資源需求、場景、部署、應(yīng)用、優(yōu)化、安全等進行實施支撐。
4.負(fù)責(zé)大數(shù)據(jù)應(yīng)用系統(tǒng)日常運維,包括日/月數(shù)據(jù)維護作業(yè)處理、系統(tǒng)安全、系統(tǒng)監(jiān)控和巡檢、牽頭處理復(fù)雜故障和預(yù)案優(yōu)化等;
5.負(fù)責(zé)大數(shù)據(jù)應(yīng)用系統(tǒng)新功能測試、上線割接和驗證,保障系統(tǒng)升級全過程的穩(wěn)定性;
6.負(fù)責(zé)大數(shù)據(jù)應(yīng)用系統(tǒng)日常問題支撐,包括問題核查、全過程管控和支撐回復(fù),提升業(yè)務(wù)人員使用系統(tǒng)的感知和滿意度。
7.負(fù)責(zé)推動運維工作朝著自動化、智能化的方向演進,負(fù)責(zé)相關(guān)技術(shù)方案選型、項目規(guī)劃與實施落地,提升整體運維管理效率。
8.負(fù)責(zé)組織或主導(dǎo)重大故障的復(fù)盤分析,推動制定并落實有效的改進措施,優(yōu)化運維流程與規(guī)范。
9.協(xié)調(diào)開發(fā)、測試、基礎(chǔ)設(shè)施、安全等團隊資源,推動解決跨領(lǐng)域的復(fù)雜運維問題,確保運維需求在項目全生命周期中得到有效落實。