職位描述:
1.負責大數(shù)據(jù)平臺的架構設計、搭建和優(yōu)化,確保平臺的穩(wěn)定性、高效性和擴展性;
2.負責設計并實現(xiàn)數(shù)據(jù)抽取、清洗、轉換(ETL)流程,從各種數(shù)據(jù)源(數(shù)據(jù)庫、文件系統(tǒng)、日志系統(tǒng)等)采集數(shù)據(jù),進行清洗和預處理,為后續(xù)分析和建模提供高質(zhì)量的數(shù)據(jù);
3.負責數(shù)據(jù)倉庫的設計和建設,構建星型、雪花型等數(shù)據(jù)模型,優(yōu)化數(shù)據(jù)存儲結構,提高數(shù)據(jù)查詢和分析效率;
4.負責支持業(yè)務部門的數(shù)據(jù)需求,提供數(shù)據(jù)分析報告和可視化報表,為業(yè)務決策提供數(shù)據(jù)支持;
5.負責配合算法團隊開展數(shù)據(jù)挖掘和機器學習相關工作,探索數(shù)據(jù)中的潛在模式和規(guī)律;
6.負責大數(shù)據(jù)團隊的建設工作,指導大數(shù)據(jù)開發(fā)、分析工程師的相關工作。
職位要求:
1.本科及以上學歷,計算機科學、統(tǒng)計學、數(shù)學、信息管理等相關專業(yè);
2.5年以上大數(shù)據(jù)相關工作經(jīng)驗,其中2年以上團隊管理經(jīng)驗,熟悉數(shù)倉建設,數(shù)據(jù)開發(fā),數(shù)據(jù)分析,數(shù)據(jù)挖掘;
3.熟練掌握至少一種編程語言,如Java、Python、Scala等,具備良好的編程習慣和代碼規(guī)范;
4.精通大數(shù)據(jù)技術棧,包括Hadoop、Spark、Hive、Flink、Kafka等,具備大數(shù)據(jù)平臺搭建與運維能力;
5.熟練掌握SQL語言,熟悉至少一種關系型數(shù)據(jù)庫(如MySQL、Oracle)和一種非關系型數(shù)據(jù)庫(如MongoDB、Redis);
6.掌握數(shù)據(jù)分析與挖掘方法,熟悉常用的數(shù)據(jù)挖掘算法(如聚類、分類、回歸等),能夠運用Python、R等數(shù)據(jù)分析工具進行數(shù)據(jù)處理與分析;
7.熟悉數(shù)據(jù)倉庫建模理論和方法,能夠設計和構建數(shù)據(jù)倉庫模型,并
8.熟悉常用的數(shù)據(jù)可視化工具(Tableau、PowerBI、Echarts、FineReport等),能夠將數(shù)據(jù)分析結果以直觀的方式展示;
9.具備較強責任心、溝通能力、邏輯思維能力、問題解決能力和創(chuàng)新能力,能夠從復雜的數(shù)據(jù)中發(fā)現(xiàn)問題、解決問題;
10、有大型大數(shù)據(jù)平臺研發(fā)經(jīng)驗、有醫(yī)藥大數(shù)據(jù)中心建設經(jīng)驗、管理15人以上數(shù)據(jù)團隊的經(jīng)驗者優(yōu)先。