崗位職責(zé):
1、負(fù)責(zé)大模型算法的研發(fā)工作,包括但不限于模型設(shè)計(jì)、prompt優(yōu)化、預(yù)訓(xùn)練、模型加速、數(shù)據(jù)集能力建設(shè)等;
2、負(fù)責(zé)大型語言模型在垂直領(lǐng)域數(shù)據(jù)上的微調(diào)、偏好對齊、知識增強(qiáng)等技術(shù)探索,結(jié)合工業(yè)界實(shí)際場景進(jìn)行大模型的效果提升;
3、建立完善的大模型評估體系,提供標(biāo)準(zhǔn)化的模型評估能力,建立完善測評數(shù)據(jù)集,通過模型測評反向驅(qū)動(dòng)和完善在大語言模型在實(shí)際業(yè)務(wù)場景中和技術(shù)迭代優(yōu)化過程中存在的問題。
任職要求:
1、1-3年以上工作經(jīng)驗(yàn),碩士及以上學(xué)歷,計(jì)算機(jī)科學(xué)、人工智能、自然語言處理或相關(guān)專業(yè);
2、熟練掌握至少一種深度學(xué)習(xí)框架,如Pytorch、TensorFlow等,熟悉Megatron、DeepSpeed等主流訓(xùn)練加速框架,有較強(qiáng)的算法工程能力;
3、扎實(shí)的算法基礎(chǔ),熟悉自然語言處理相關(guān)理論,熟悉Transformer/GPT/LLaMA等基礎(chǔ)模型結(jié)構(gòu),熟悉大模型的微調(diào)和評估方法;
4、具備優(yōu)秀的分析和解決問題的能力,良好的溝通學(xué)習(xí)及自驅(qū)能力;
5、有相關(guān)領(lǐng)域?qū)W術(shù)論文、優(yōu)秀開源項(xiàng)目、高水平競賽獲獎(jiǎng)?wù)邇?yōu)先。