【工作職責(zé)】
基于業(yè)務(wù)場景需求,分析大模型應(yīng)用的技術(shù)路徑,設(shè)計(jì)針對性微調(diào)方案與評估體系。
基于大模型微調(diào)框架,完成模型參數(shù)調(diào)優(yōu)、領(lǐng)域適配及性能優(yōu)化,提升模型任務(wù)表現(xiàn)。
構(gòu)建高質(zhì)量訓(xùn)練數(shù)據(jù)集,設(shè)計(jì)數(shù)據(jù)增強(qiáng)策略,開發(fā)數(shù)據(jù)清洗與標(biāo)注工具鏈。
搭建模型評估平臺,設(shè)計(jì)多維度測試用例,持續(xù)監(jiān)控并優(yōu)化模型推理效果。
研究模型蒸餾、量化、加速等技術(shù),推動大模型在具體業(yè)務(wù)場景的工程化落地。
【任職要求】
計(jì)算機(jī)、人工智能相關(guān)專業(yè)碩士及以上學(xué)歷,3年以上NLP、深度學(xué)習(xí)研發(fā)經(jīng)驗(yàn)。
深入理解Transformer架構(gòu),熟悉BERT、GPT、DeepSeek等主流大模型的技術(shù)原理與實(shí)現(xiàn)細(xì)節(jié)。
掌握PyTorch、TensorFlow等框架,具備分布式訓(xùn)練實(shí)戰(zhàn)經(jīng)驗(yàn)。
精通Prompt工程、LoRA、P-tuning等微調(diào)技術(shù),具有多任務(wù)遷移學(xué)習(xí)項(xiàng)目經(jīng)驗(yàn)。
熟悉HuggingFace生態(tài),具備完整的大模型訓(xùn)練-評估-部署全鏈路開發(fā)能力。
具備優(yōu)秀的數(shù)據(jù)處理能力,熟悉SQL/NoSQL數(shù)據(jù)庫及大數(shù)據(jù)處理框架。
對模型安全、可解釋性有深入理解,具有大模型對齊經(jīng)驗(yàn)者優(yōu)先。