工作職責(zé):
1.使用爬蟲技術(shù)采集指定的互聯(lián)網(wǎng)數(shù)據(jù);
2.對(duì)采集的數(shù)據(jù)進(jìn)行清洗治理;
3 負(fù)責(zé)爬蟲系統(tǒng)外部調(diào)用接口的實(shí)現(xiàn)。
任職要求:
1.本科以上學(xué)歷,計(jì)算機(jī)相關(guān)專業(yè) ,3年以上爬蟲工作經(jīng)驗(yàn),獨(dú)立設(shè)計(jì)開發(fā)爬蟲系統(tǒng);
2 精通Python語言,熟練掌握主流爬蟲框架;熟悉常用的庫requests/gevent等;
3.了解各種加密算法,能夠獨(dú)立解決js反爬和模擬登陸問題等問題;
4.熟練掌握正則表達(dá)式、XPath、CSS等網(wǎng)頁信息抽取技術(shù);
5. 熟悉常見反爬機(jī)制,驗(yàn)證碼識(shí)別,IP代理池、應(yīng)用Ip池、headers認(rèn)證和cookie等;
6. 熟練使用Selenium等爬蟲框架實(shí)施動(dòng)態(tài)抓?。?
7.熟悉熟練使用charles、fiddler等抓包工具者優(yōu)先。