崗位職責(zé):
一、電商平臺(tái)數(shù)據(jù)爬取
1、負(fù)責(zé)設(shè)計(jì)分布式爬蟲系統(tǒng),采集抖、快、拼等電商平臺(tái)的商品信息(訂單信息、店鋪信息、評(píng)論等);
2、應(yīng)對(duì)反爬機(jī)制(IP封鎖、驗(yàn)證碼、動(dòng)態(tài)加載),使用代理IP、Selenium模擬瀏覽器等技術(shù)突破限制;
3、優(yōu)化爬蟲性能,包括并行化爬取、數(shù)據(jù)去重、異步IO等技術(shù)提升效率;
4、數(shù)據(jù)清洗與存儲(chǔ):通過正則表達(dá)式/XPath解析數(shù)據(jù),存儲(chǔ)至MySQL/MongoDB等數(shù)據(jù)庫。
二、 智能體搭建與系統(tǒng)開發(fā)
1、開發(fā)AI智能體開發(fā),新媒體推廣智能體與辦公智能體的開發(fā)實(shí)施;
2、參與自動(dòng)化系統(tǒng)(如訂貨單生成、報(bào)表統(tǒng)計(jì)),結(jié)合爬蟲與業(yè)務(wù)需求提升效率
維護(hù)爬蟲服務(wù)器,監(jiān)控任務(wù)調(diào)度與報(bào)警反饋,確保系統(tǒng)穩(wěn)定性;
三、數(shù)字人建模開發(fā)(優(yōu)先項(xiàng))
1、熟悉自然語言處理(NLP)或機(jī)器學(xué)習(xí)算法,支持智能客服、問答機(jī)器人等應(yīng)用;
2、具備數(shù)據(jù)挖掘經(jīng)驗(yàn),能構(gòu)建用戶行為分析或個(gè)性化推薦系統(tǒng)/3
有數(shù)字人從0-1搭建開發(fā)并上線經(jīng)驗(yàn)優(yōu)先;
任職要求 :
一、技術(shù)能力
1、精通Python開發(fā),熟悉Scrapy、Requests、Selenium等爬蟲框架;
2、掌握HTML/CSS/JS解析技術(shù)(XPath、正則表達(dá)式、Beautiful Soup);
3、熟悉數(shù)據(jù)庫優(yōu)化(MySQL、MongoDB)及分布式存儲(chǔ)原理;
4、了解HTTP協(xié)議、抓包工具(Fiddler、Charles)及逆向工程(APP反編譯、JS解密)。
二、經(jīng)驗(yàn)要求
1、5年以上Python開發(fā)經(jīng)驗(yàn),3年以上電商數(shù)據(jù)爬取實(shí)戰(zhàn)經(jīng)驗(yàn);
2、有AI智能體開發(fā)經(jīng)驗(yàn);
3、具備數(shù)字人建模、機(jī)器學(xué)習(xí)或大數(shù)據(jù)處理(Hadoop/Spark)經(jīng)驗(yàn)者優(yōu)先
三、軟性要求
1、計(jì)算機(jī)相關(guān)專業(yè)本科及以上學(xué)歷;
2、良好的編碼規(guī)范,能獨(dú)立解決問題并優(yōu)化系統(tǒng)性能;
3、適應(yīng)高強(qiáng)度工作,具備團(tuán)隊(duì)協(xié)作與跨部門溝通能力