崗位要求:
1、碩士及以上學(xué)歷,計(jì)算機(jī)、人工智能等相關(guān)專(zhuān)業(yè)畢業(yè);
2、實(shí)驗(yàn)?zāi)芰?qiáng)(可快速?gòu)?fù)現(xiàn)前沿技術(shù)并評(píng)估可行性)、實(shí)戰(zhàn)能力強(qiáng)(技術(shù)方案通過(guò)可行性評(píng)估后,具備獨(dú)立封裝算法模型的能力);
3、精通Python、C/C++(可選)等編程語(yǔ)言,熟練掌握PyTorch等主流深度學(xué)習(xí)框架,Transformers、Vlm等;
4、熟悉大模型分布式訓(xùn)練技術(shù)和框架庫(kù),如DeepSpeed等,熟悉框架庫(kù)源碼,有多卡或多機(jī)的大模型訓(xùn)練經(jīng)驗(yàn);
5、熟悉知識(shí)圖譜相關(guān)技術(shù)原因、圖數(shù)據(jù)等技術(shù);
6、精通大模型推理優(yōu)化技術(shù)、精通各種微調(diào)技術(shù),如LORA、QLORA、SFT、DPO等。
崗位職責(zé):
1、負(fù)責(zé)大模型相關(guān)場(chǎng)景的工程化落地,探索業(yè)界先進(jìn)的大模型(及架構(gòu))、Agent技術(shù)/框架、前沿RAG技術(shù)等;
2、圍繞大模型(包括多模態(tài))領(lǐng)域,構(gòu)建從數(shù)據(jù)采集、加工標(biāo)注、算法訓(xùn)練部署至推理加速等;
3、負(fù)責(zé)大模型的結(jié)構(gòu)設(shè)計(jì)、訓(xùn)練、微調(diào)、部署和優(yōu)化,提高模型的效率、穩(wěn)定性和可擴(kuò)展性;
4、跟蹤國(guó)內(nèi)外前沿的大模型技術(shù)動(dòng)態(tài),持續(xù)改進(jìn)和優(yōu)化現(xiàn)有模型;
5、負(fù)責(zé)知識(shí)圖譜(知識(shí)及index)全自動(dòng)化構(gòu)建,全流程(抽取、融合、消歧等)優(yōu)化等。