崗位職責(zé):
1、負(fù)責(zé)公司云平臺(tái)、業(yè)務(wù)應(yīng)用和數(shù)據(jù)平臺(tái)的系統(tǒng)監(jiān)控運(yùn)維體系、架構(gòu)、技術(shù)、指標(biāo)及標(biāo)準(zhǔn)、規(guī)范等規(guī)劃和自動(dòng)化監(jiān)控、運(yùn)維工具的迭代開發(fā),保證業(yè)務(wù)應(yīng)用的可靠運(yùn)行,持續(xù)提升系統(tǒng)智能化運(yùn)維能力;
2、作為系統(tǒng)運(yùn)維專家參與并指導(dǎo)、配合公司云、網(wǎng)、應(yīng)用和數(shù)據(jù)業(yè)務(wù)團(tuán)隊(duì)進(jìn)行系統(tǒng)技術(shù)架構(gòu)和關(guān)鍵技術(shù)標(biāo)準(zhǔn)和規(guī)范的設(shè)計(jì)、評(píng)審、優(yōu)化和管理;
3、負(fù)責(zé)核心業(yè)務(wù)應(yīng)用重要系統(tǒng)環(huán)境的運(yùn)維,對(duì)系統(tǒng)風(fēng)險(xiǎn)、異常告警、性能瓶頸進(jìn)行分析、快速定位,并解決疑難問題,保證業(yè)務(wù)應(yīng)用7x24小時(shí)穩(wěn)定運(yùn)行;
4、作為系統(tǒng)運(yùn)維專家,負(fù)責(zé)根據(jù)系統(tǒng)運(yùn)行情況和事件對(duì)業(yè)務(wù)應(yīng)用系統(tǒng)環(huán)境架構(gòu)提出優(yōu)化建議方案,包括但不限于架構(gòu)、性能、服務(wù)、部署、資源、高可靠性、冗余備份、預(yù)案和監(jiān)控管理等;
5、總結(jié)沉淀系統(tǒng)運(yùn)維知識(shí),推進(jìn)運(yùn)維知識(shí)庫、運(yùn)維服務(wù)標(biāo)準(zhǔn)和運(yùn)維自動(dòng)化的建設(shè)和落地;
6、制定和優(yōu)化系統(tǒng)運(yùn)維解決方案,包括但不限于傳統(tǒng)架構(gòu)、云平臺(tái)、微服務(wù)、分布式環(huán)境等復(fù)雜化境的高可用、彈性擴(kuò)容等;
7、負(fù)責(zé)對(duì)一二線運(yùn)維工程師進(jìn)行系統(tǒng)運(yùn)維賦能培訓(xùn),有效提升團(tuán)隊(duì)運(yùn)維能力;
8、協(xié)助團(tuán)隊(duì)制定監(jiān)控運(yùn)維管理流程及規(guī)范,不斷健全一體化智能運(yùn)維服務(wù)體系。
任職條件:
1、統(tǒng)招本科及以上學(xué)歷,計(jì)算機(jī)或安全相關(guān)專業(yè),10年及以上系統(tǒng)建設(shè)與運(yùn)維經(jīng)驗(yàn);
2、對(duì)分布式架構(gòu)和微服務(wù)治理相關(guān)理論、技術(shù)有較深入的研究,具有豐富的集群、負(fù)載均衡、虛擬化、容器、容災(zāi)及微服務(wù)和云平臺(tái)架構(gòu)等高可靠系統(tǒng)環(huán)境設(shè)計(jì)、規(guī)劃、實(shí)施和運(yùn)維經(jīng)驗(yàn);
3、精通架構(gòu)優(yōu)化、資源規(guī)劃、性能優(yōu)化和緩存、存儲(chǔ)、消息、故障、隔離、監(jiān)控、限流、降級(jí)、預(yù)案等機(jī)制、原理和策略,有較強(qiáng)的系統(tǒng)故障分析處置能力和豐富的故障應(yīng)急處置經(jīng)驗(yàn);
4、精通主流通訊協(xié)議TCP、HTTP、FTP、SSL/TLS、DNS等基本原理,掌握常用協(xié)議分析工具;
5、精通linux系統(tǒng)及內(nèi)核,熟練Linux部署、維護(hù)和優(yōu)化操作;
6、熟悉mysql和redis、mongodb、HBase等數(shù)據(jù)庫,具有高可用架構(gòu)架構(gòu)設(shè)計(jì)、部署、優(yōu)化和管理維護(hù)經(jīng)驗(yàn);
7、精通虛擬化KVM、Docker、k8s等技術(shù),具有豐富的實(shí)施應(yīng)用和優(yōu)化維護(hù)經(jīng)驗(yàn);
8、精通常用Redis、Memcache、Nginx、Apache、MQ、Kakfa、Tomcat等中間件,具有高可用架構(gòu)設(shè)計(jì)、開發(fā)和調(diào)優(yōu)經(jīng)驗(yàn);
9、熟練使用Shell、Python、Go、powershell等自動(dòng)化腳本編程語言的一種,有一定的運(yùn)維開發(fā)能力;
10、熟悉zabbix、Promethe等監(jiān)控系統(tǒng),熟練ELK/ Elasticsearch等日志收集與分析工具,熟悉grafana等數(shù)據(jù)匯集和可視化系統(tǒng);
11、熟悉基于指標(biāo)或日志進(jìn)行動(dòng)態(tài)指標(biāo)、模型的優(yōu)化開發(fā)和升級(jí)報(bào)警能力,具備突發(fā)事件危機(jī)處理能力;
12、對(duì)技術(shù)有著特別的渴求,有較強(qiáng)的表達(dá)和溝通能力,對(duì)技術(shù)問題有清晰的思維和全局邏輯,高度敬業(yè)精神,團(tuán)隊(duì)意識(shí)強(qiáng)。