1、基于公司業(yè)務(wù)場景,負責大規(guī)模方向的研發(fā)工作,包括但不限于NLP、CV及多模態(tài)等領(lǐng)域;
2、深入理解業(yè)務(wù)需求,完成垂直領(lǐng)域大模型精調(diào)與輕量化部署,構(gòu)建Agent應用,支撐產(chǎn)品能力需求;
3、參與構(gòu)建高質(zhì)量的數(shù)據(jù)集,基于實際需求進行深入分析以指導后續(xù)改進方向;
4、將開發(fā)完成的模型部署到生產(chǎn)環(huán)境中,配合相關(guān)團隊完成系統(tǒng)的聯(lián)調(diào)聯(lián)試,確保其穩(wěn)定可靠地運行;
5、構(gòu)建和維護大模型的測試框架,優(yōu)化測試流程,提升測試效率。
6、深入分析測試數(shù)據(jù),提取關(guān)鍵性能指標,為模型優(yōu)化提供數(shù)據(jù)支持。
7、跟蹤相關(guān)領(lǐng)域技術(shù)動態(tài),撰寫技術(shù)報告,為團隊技術(shù)發(fā)展提供建議和支撐
任職要求:
1、擁有計算機科學、人工智能、數(shù)學等相關(guān)專業(yè)碩士及以上學位者優(yōu)先考慮;
2、熟練掌握Python,精通TensorFlow、PyTorch等至少一種主流深度學習框架;
3、對機器學習、深度學習理論有深刻理解;熟悉NLP或CV領(lǐng)域常用技術(shù)和工具;
4、熟悉大模型SFT訓練方法,包括LoRA、P-tuning、Prefix-Tuning等,具有大模型訓練、性能調(diào)優(yōu)經(jīng)驗;
5、了解常用的大模型能力評測Benchmark,對大模型能力評測體系和系統(tǒng)有基本了解;
6、具有垂直領(lǐng)域LangChain、LLaMAIndex、AutoGPT應用開發(fā)落地經(jīng)驗者優(yōu)先;
7、英文讀寫流利,能夠無障礙閱讀英文文獻資料;
8、具備良好的溝通協(xié)調(diào)能力和團隊合作精神,心態(tài)樂觀、積極面對挑戰(zhàn)。