崗位職責(zé):
1. Python開發(fā),負(fù)責(zé)系統(tǒng)功能模塊設(shè)計(jì)、編碼與調(diào)試,保障項(xiàng)目高效穩(wěn)定交付。
2. 支持視覺(jué)大模型的應(yīng)用場(chǎng)景開發(fā),包括但不限于圖像生成、目標(biāo)檢測(cè)、人臉識(shí)別、圖像分割與視頻分析。
3. 探索多模態(tài)融合技術(shù),將視覺(jué)模型與其他模態(tài)(如文本、音頻)結(jié)合,實(shí)現(xiàn)跨模態(tài)任務(wù)。
4. 挖掘和研發(fā)視頻標(biāo)簽搜索, 視頻剪輯等基于AI的視頻算法并落地
5. 基于RAG構(gòu)建并優(yōu)化相關(guān)應(yīng)用系統(tǒng),提升數(shù)據(jù)利用與內(nèi)容生成的精準(zhǔn)性和效率。
6. 編寫、優(yōu)化提示詞策略,引導(dǎo)大模型輸出符合需求的結(jié)果,提升人機(jī)交互效果。
任職要求:
1. 教育背景:
計(jì)算機(jī)科學(xué)、人工智能、數(shù)學(xué)等相關(guān)專業(yè)碩士及以上學(xué)歷
2. 技術(shù)能力:
精通深度學(xué)習(xí)框架( PyTorch、TensorFlow)。
熟悉主流視覺(jué)或音頻模型(如 Qwen VL、OpenAI Clip、DINOv2、YOLO、Whisper)。
具備扎實(shí)的圖像處理、計(jì)算機(jī)視覺(jué)和深度學(xué)習(xí)理論基礎(chǔ)。
3. 算法與工程經(jīng)驗(yàn):
熟悉圖文/視頻文本多模態(tài)建模與應(yīng)用,在以下領(lǐng)域有深入的研究及落地經(jīng)驗(yàn),包括但不限于:視頻分析理解、RAG、自監(jiān)督/多模態(tài)弱監(jiān)督,跨模態(tài)檢索與生成、AI agent等。
4. 編程能力:
精通Python編程語(yǔ)言。
5. 團(tuán)隊(duì)協(xié)作與溝通:自驅(qū)力強(qiáng),具備良好的團(tuán)隊(duì)合作精神,善于溝通交流,能夠與不同崗位的團(tuán)隊(duì)成員緊密協(xié)作,共同完成項(xiàng)目目標(biāo)。
加分項(xiàng):
1. 有多模態(tài)圖文內(nèi)容生成系統(tǒng)全流程開發(fā)經(jīng)驗(yàn)者優(yōu)先(數(shù)據(jù)采標(biāo)、數(shù)據(jù)清洗、模型設(shè)計(jì)、跨域?qū)R、提示詞工程)
2. 掌握VUE框架,熟悉前端開發(fā)流程,能夠獨(dú)立完成前端頁(yè)面的開發(fā)與優(yōu)化工作,有實(shí)際項(xiàng)目經(jīng)驗(yàn)者優(yōu)先
3. 英文CET-6以上,可以閱讀撰寫英文技術(shù)文檔。