崗位職責(zé):
1、大數(shù)據(jù)處理和分析·負(fù)責(zé)大數(shù)據(jù)的收集、組織、清理、分析,以提取支持業(yè)務(wù)決策的有價值的見解?!ぴO(shè)計和優(yōu)化數(shù)據(jù)存儲、清理和處理工作流程,以提高數(shù)據(jù)利用率?!みM(jìn)行數(shù)據(jù)探索,以識別關(guān)鍵業(yè)務(wù)指標(biāo)的潛在影響因素,并提供數(shù)據(jù)驅(qū)動的業(yè)務(wù)見解。
2、機(jī)器學(xué)習(xí)建模和優(yōu)化·應(yīng)用機(jī)器學(xué)習(xí)算法和模型來解決實(shí)際業(yè)務(wù)問題,如預(yù)測分析、用戶行為分析和風(fēng)險評估?!ぴO(shè)計、訓(xùn)練、優(yōu)化和部署機(jī)器學(xué)習(xí)和深度學(xué)習(xí)模型,以增強(qiáng)業(yè)務(wù)預(yù)測能力。·在生產(chǎn)環(huán)境中進(jìn)行模型評估、超參數(shù)優(yōu)化和監(jiān)控模型性能,以不斷提高準(zhǔn)確性和性能。
3.大數(shù)據(jù)技術(shù)堆棧和數(shù)據(jù)工程·使用分布式計算框架(例如,Spark、Hadoop、Flink)處理PB級數(shù)據(jù),提高計算效率?!な煜ぴ破脚_(例如,AWS、Azure、GCP)上的數(shù)據(jù)存儲和計算優(yōu)化解決方案?!?gòu)建和優(yōu)化數(shù)據(jù)管道、ETL流程、數(shù)據(jù)倉庫和數(shù)據(jù)湖,以確保流暢、穩(wěn)定、高效的數(shù)據(jù)流。
4.數(shù)據(jù)可視化和決策支持·設(shè)計和開發(fā)可視化儀表板和報告(例如,Tableau、Power BI、Matplotlib、Seborn),使復(fù)雜的數(shù)據(jù)更加直觀和易于理解?!ねㄟ^A/B測試和因果推理等方法提供數(shù)據(jù)支持,以優(yōu)化業(yè)務(wù)策略。
5.跨團(tuán)隊協(xié)作和技術(shù)研究·與業(yè)務(wù)、產(chǎn)品和工程團(tuán)隊密切合作,了解業(yè)務(wù)需求,并提供數(shù)據(jù)驅(qū)動的決策支持。·緊跟最新的行業(yè)技術(shù)發(fā)展,探索新的數(shù)據(jù)分析和機(jī)器學(xué)習(xí)方法,并將其應(yīng)用到實(shí)際的業(yè)務(wù)場景中。
任職資格:
1、教育背景·計算機(jī)科學(xué)、統(tǒng)計學(xué)、數(shù)學(xué)、數(shù)據(jù)科學(xué),或相關(guān)領(lǐng)域的本科及以上學(xué)歷。
2、專業(yè)技能·編程技能:精通Python(優(yōu)先)或R,具有扎實(shí)的編程基礎(chǔ),熟悉常用的數(shù)據(jù)處理和分析庫,如Scikit-Learning、XGBoost、TensorFlow、PyTorch、Pandas、NumPy、Matplotlib、Seborn等。·機(jī)器學(xué)習(xí):深入了解回歸、決策樹、隨機(jī)森林、XGBoost、深度學(xué)習(xí)(CNN、RNN、Transform)等算法,并能夠?qū)⑵鋺?yīng)用到實(shí)際項目中?!ご髷?shù)據(jù)處理:熟練掌握Hadoop、Spark、Flink、Kafka、Hive、HBase等大數(shù)據(jù)處理技術(shù),具備處理大規(guī)模數(shù)據(jù)的能力?!?shù)據(jù)庫和SQL:熟悉SQL和非關(guān)系型數(shù)據(jù)庫(如MongoDB、Cassandra),具備高效數(shù)據(jù)查詢、存儲和管理的能力?!?shù)學(xué)和統(tǒng)計學(xué):具有較強(qiáng)的數(shù)學(xué)和統(tǒng)計學(xué)基礎(chǔ),具備概率論、數(shù)理統(tǒng)計、線性代數(shù)、優(yōu)化方法等知識。
3.項目經(jīng)驗·3年以上大數(shù)據(jù)分析和機(jī)器學(xué)習(xí)經(jīng)驗,至少有3個完整的項目經(jīng)驗。·參與數(shù)據(jù)挖掘、預(yù)測分析、機(jī)器學(xué)習(xí)模型開發(fā)等項目,具備獨(dú)立完成從數(shù)據(jù)采集、清洗、特征工程、模型訓(xùn)練和部署的整個過程的能力?!び蠱LOps(例如,MLflow、Kubeflow、Airflow)經(jīng)驗者優(yōu)先,具有在生產(chǎn)中部署和監(jiān)控模型的能力。
4.個人能力和素質(zhì)·邏輯思維:具有較強(qiáng)的邏輯分析和解決問題的能力,能夠快速解決復(fù)雜的數(shù)據(jù)問題?!F(tuán)隊協(xié)作:具有出色的溝通能力和與來自不同背景的團(tuán)隊成員有效協(xié)作的能力?!?shù)據(jù)敏感性:對數(shù)據(jù)高度敏感,具有出色的數(shù)據(jù)分析和洞察力,能夠從數(shù)據(jù)中識別潛在的業(yè)務(wù)價值。·自我激勵:具有較強(qiáng)的學(xué)習(xí)能力和好奇心,能夠持續(xù)關(guān)注數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)的最新發(fā)展。
加分項(非必需,但優(yōu)先):
具有自然語言處理(NLP)、計算機(jī)視覺或推薦系統(tǒng)方面的經(jīng)驗,為業(yè)務(wù)擴(kuò)展提供額外的技術(shù)支持(例如,多語言文本分析、圖像識別、個性化推薦)。·熟悉A/B測試、因果推理和強(qiáng)化學(xué)習(xí)等方法?!び锌缇郴蚨嗾Z言數(shù)據(jù)處理經(jīng)驗,例如處理全球數(shù)據(jù)集以支持國際業(yè)務(wù)擴(kuò)展。