崗位職責(zé):
1.負責(zé)多模態(tài)(文本+圖像)大模型的預(yù)訓(xùn)練、微調(diào)與評估,包括LLM、Diffusion、Vision-Language模型等;
2.參與構(gòu)建和優(yōu)化模型訓(xùn)練數(shù)據(jù)集,包括文本、圖像、圖文對等;
3.負責(zé)訓(xùn)練框架的開發(fā)與優(yōu)化,如分布式訓(xùn)練、混合精度訓(xùn)練、參數(shù)高效微調(diào)(LoRA、PEFT 等);
4.跟進前沿研究,推動模型性能優(yōu)化和推理效率提升;
5.與產(chǎn)品、算法、后端等團隊緊密合作,推動模型落地。
任職要求:
1.計算機、人工智能、圖像處理、自然語言處理等相關(guān)專業(yè)本科及以上學(xué)歷,優(yōu)秀者可放寬;
2.熟悉大模型架構(gòu)(如Transformer、Diffusion、CLIP、BLIP、SD等),并有實際訓(xùn)練經(jīng)驗;
3.熟練掌握 PyTorch、Transformers、Diffusers、DeepSpeed、Accelerate 等主流框架;
4.具備多模態(tài)數(shù)據(jù)處理與標(biāo)注經(jīng)驗,有AIGC相關(guān)項目經(jīng)驗者優(yōu)先;
5.具備良好的工程實現(xiàn)能力和團隊協(xié)作精神;
6.有較強的英文文獻閱讀和技術(shù)文檔撰寫能力。
加分項:
1.有開源項目經(jīng)驗或在頂會發(fā)表論文;
2.了解 Stable Diffusion、SDXL、LLaVA、MiniGPT-4、InternLM-XComposer 等項目;
3.有AI繪圖或文生圖產(chǎn)品開發(fā)經(jīng)驗者優(yōu)先。