機(jī)器學(xué)習(xí)算法工程師
關(guān)鍵詞
機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、Python、Spark、Scala
崗位職責(zé):
1、根據(jù)業(yè)務(wù)需求,設(shè)計(jì)并實(shí)現(xiàn)高效的數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)模型,包括但不限于風(fēng)控、推薦、用戶行為分析等領(lǐng)域;
2、使用SQL進(jìn)行特征開(kāi)發(fā),為機(jī)器學(xué)習(xí)算法模型提供高質(zhì)量的特征輸入;
3、基于Spark和Scala技術(shù)棧在大規(guī)模數(shù)據(jù)集上進(jìn)行模型訓(xùn)練和優(yōu)化,應(yīng)用類似XGBoost、LightGBM等算法;
4、對(duì)用戶行為數(shù)據(jù)進(jìn)行深入分析,通過(guò)Spark框架支持?jǐn)?shù)據(jù)分析和決策制定,同時(shí)監(jiān)控模型表現(xiàn)并持續(xù)優(yōu)化;
5、參與整個(gè)模型生命周期的管理,從特征工程到模型部署,確保模型的準(zhǔn)確性和穩(wěn)定性。
崗位要求:
1、計(jì)算機(jī)科學(xué)、統(tǒng)計(jì)學(xué)、數(shù)學(xué)等相關(guān)專業(yè)本科及以上學(xué)歷,具有3年以上相關(guān)領(lǐng)域工作經(jīng)驗(yàn);
2、精通數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)等算法,對(duì)深度學(xué)習(xí)有一定的了解以及應(yīng)用,例如LR(邏輯回歸)、SVM(支持向量機(jī))、XGBOOST、ANN(人工神經(jīng)網(wǎng)絡(luò))、RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))、CNN(卷積神經(jīng)網(wǎng)絡(luò));
3、精通SQL用于特征開(kāi)發(fā),具備高效的數(shù)據(jù)處理和特征工程能力;熟練使用Spark和Scala進(jìn)行大規(guī)模數(shù)據(jù)處理和模型開(kāi)發(fā);熟悉Hadoop、Hive、HBase等大數(shù)據(jù)生態(tài)圈工具,有實(shí)際項(xiàng)目經(jīng)驗(yàn)者優(yōu)先;
4、具備Python編程能力,能夠在必要時(shí)使用Python進(jìn)行算法研究或快速原型開(kāi)發(fā);
5、對(duì)數(shù)據(jù)敏感,熟悉數(shù)據(jù)分析流程,具備解決復(fù)雜業(yè)務(wù)問(wèn)題的能力;
6、良好的溝通能力和團(tuán)隊(duì)合作精神,能夠積極主動(dòng)地發(fā)現(xiàn)問(wèn)題并提出解決方案;
7、有撰寫科技專利或軟件著作權(quán)材料的經(jīng)驗(yàn)者更佳。
1是有傳統(tǒng)機(jī)器學(xué)習(xí)的應(yīng)用能力,2是有大規(guī)模數(shù)據(jù)加工、處理經(jīng)驗(yàn)。目前主要是用xgboost、lightgbm這種經(jīng)典算法,用SQL處理數(shù)據(jù)。有這2個(gè)能力即可,其他都是加分項(xiàng)