崗位職責(zé):
1.開源大模型框架部署及微調(diào);
2.大模型技術(shù)團(tuán)隊(duì)的規(guī)劃及培訓(xùn);
3.相關(guān)模型的技術(shù)文檔撰寫,協(xié)助公司售前落單相關(guān)項(xiàng)目;
4.可以基于大模型去衍生相關(guān)應(yīng)用產(chǎn)品。
技能要求:
1.本科及以上學(xué)歷。
2.熟練掌握一種或多種主流深度學(xué)習(xí)框架,如 TensorFlow、PyTorch、Hugging Face 等。
3.深入理解 Transformer、BERT、GPT、Llama 等語(yǔ)言模型的結(jié)構(gòu)和原理,熟悉大模型的訓(xùn)練機(jī)制,如預(yù)訓(xùn)練、微調(diào)訓(xùn)練等。
4.熟練掌握 Python、Java、Go 等編程語(yǔ)言中的一種或多種。
5.了解自然語(yǔ)言處理的基本概念、原理和方法,熟悉常見的 NLP 任務(wù)和算法,如文本分類、情感分析、機(jī)器翻譯、命名實(shí)體識(shí)別等。
6.掌握機(jī)器學(xué)習(xí)的基本算法和原理,能夠根據(jù)實(shí)際問(wèn)題選擇合適的算法進(jìn)行模型訓(xùn)練和優(yōu)化。
7.熟悉視覺(jué)、語(yǔ)言等多模態(tài)數(shù)據(jù)的處理和融合方法,了解相關(guān)的模型和技術(shù)。
8.大模型應(yīng)用開發(fā)經(jīng)驗(yàn)優(yōu)先,如在 RAG(檢索增強(qiáng)生成)、NL2SQL(自然語(yǔ)言轉(zhuǎn)結(jié)構(gòu)化查詢語(yǔ)言)、ChatBI(基于聊天的商業(yè)智能)、NL2API(自然語(yǔ)言轉(zhuǎn)應(yīng)用程序接口)、Agent(智能體)等模塊的研發(fā)與應(yīng)用落地經(jīng)驗(yàn)者優(yōu)先。
9.模型訓(xùn)練與調(diào)優(yōu)經(jīng)驗(yàn),熟悉分布式訓(xùn)練框架,如 DeepSpeed、Megatron 等,具備在大規(guī)模數(shù)據(jù)集上進(jìn)行模型訓(xùn)練的能力,有 LLM(大型語(yǔ)言模型)中的預(yù)訓(xùn)練、SFT(有監(jiān)督微調(diào))、RLHF(基于人類反饋的強(qiáng)化學(xué)習(xí))等相關(guān)訓(xùn)練經(jīng)驗(yàn)者優(yōu)先。