崗位職責(zé):
1.負(fù)責(zé)構(gòu)建數(shù)字化智能運(yùn)維平臺,為運(yùn)維團(tuán)隊(duì)提供全鏈路的一站式運(yùn)維工具平臺;
2.配合運(yùn)維團(tuán)隊(duì)進(jìn)行云平臺的管理和運(yùn)維,包括但不限于Kubernetes、Docker等容器編排工具的使用;
3.負(fù)責(zé)集成各種來源數(shù)據(jù),支持AI模型訓(xùn)練和業(yè)務(wù)需求,分析業(yè)務(wù)團(tuán)隊(duì)的需求,構(gòu)建端到端數(shù)據(jù)管道;
4.負(fù)責(zé)系統(tǒng)運(yùn)維服務(wù)的設(shè)計(jì)與落地,涵蓋持續(xù)交付,容量優(yōu)化,成本優(yōu)化,故障處理優(yōu)化等方向;
5.建設(shè)數(shù)據(jù)倉庫架構(gòu)及相關(guān)子系統(tǒng),包括:工作流管理、數(shù)據(jù)管理、數(shù)據(jù)質(zhì)量監(jiān)控、高效數(shù)據(jù)同步、流式數(shù)據(jù)同步、多維數(shù)據(jù)分析引擎等;
6.負(fù)責(zé)探索運(yùn)維自動(dòng)化和智能化技術(shù)方向;
崗位要求:
1、精通 Linux 環(huán)境開發(fā),具備扎實(shí)的程序設(shè)計(jì)能力,熟練掌握 Go/Python/C++/Java 中至少一門程序開發(fā)語言,熟練掌握至少一個(gè)常見
Web 框架(如Django/Flask/SpringCloud 等)及其設(shè)計(jì)原理;
2、深入理解Linux操作系統(tǒng),精通 TCP/IP、HTTP等協(xié)議,具備扎實(shí)的網(wǎng)絡(luò)、系統(tǒng)結(jié)構(gòu)方面的知識;
3、精通各類消息中間件以及常見存儲軟件,如Redis/MySQL/OSS/Kafka/RocketMQ等;
4、精通K8S 等云原生相關(guān)生態(tài),有大型系統(tǒng)的運(yùn)維管理平臺/工具開發(fā)經(jīng)驗(yàn)者優(yōu)先;
5、精通Hadoop,Hive,Hbase,Spark,Doris,Flink,Flume等開源技術(shù),有3年以上的實(shí)際工作經(jīng)驗(yàn),有互聯(lián)網(wǎng)公司大規(guī)模數(shù)據(jù)平臺建設(shè)經(jīng)驗(yàn)者優(yōu)先;
6、精通機(jī)器學(xué)習(xí)/深度學(xué)習(xí)/生成式AI等相關(guān)技術(shù),掌握TensorFlow、PyTorch等框架,具備編寫數(shù)據(jù)分析、大語言模型、檢索增強(qiáng)的能力&經(jīng)驗(yàn);
7、具備學(xué)習(xí)新技術(shù)的能力和邏輯思維能力,關(guān)注前沿技術(shù),能夠持續(xù)學(xué)習(xí)。