需求:負責(zé)人工智能相關(guān)工作,包括但不限于數(shù)據(jù)收集,分析和模型搭建工作
深入理解Kimi,清華智普等產(chǎn)品研發(fā)和大模型算法迭代的全流程,與跨職能團隊(產(chǎn)品設(shè)計,算法,數(shù)據(jù)分析等)緊密合作,以自身技術(shù)能力和一定的產(chǎn)品設(shè)計思維來影響,規(guī)劃和決策發(fā)展路線
有大規(guī)模分布式的經(jīng)驗,對于LLM有深入的認知和理解,包括AIGC,Chagpt等產(chǎn)品有大量的業(yè)務(wù)落地實戰(zhàn)經(jīng)驗
推進數(shù)據(jù)建設(shè),指令微調(diào),偏好對齊,模型優(yōu)化方面的工作,提高模型質(zhì)量和適應(yīng)性
與跨智能團隊(包括數(shù)據(jù)科學(xué)家,軟件工程師,產(chǎn)品經(jīng)理等)緊密合作
在問答技術(shù),文本糾錯,風(fēng)險控制,知識圖譜等領(lǐng)域有實戰(zhàn)經(jīng)驗
搭建AI原生產(chǎn)品的核心功能
負責(zé)大模型在垂域和特定場景下的繼續(xù)訓(xùn)練,包括研發(fā)繼續(xù)預(yù)訓(xùn)練,全量/高效微調(diào)和強化學(xué)習(xí)算法
負責(zé)落地大模型在工業(yè)級應(yīng)用算法,包括但不限于智能問答,知識圖譜RAG和Agent
負責(zé)大模型推理優(yōu)化,研發(fā)模型壓縮算法和優(yōu)化推理加速框架
資格:
優(yōu)秀的代碼能力和數(shù)據(jù)結(jié)構(gòu)和基礎(chǔ)算法工地,熟練python,java等開發(fā)語言
熟練NLP,CV相關(guān)的算法和技術(shù),熟悉大模型訓(xùn)練,RL算法等
熟練transformer架構(gòu),BERT,GPT-4等
熟練Agent,Prompt,RAG,langchain框架和模型訓(xùn)練和部署
進行數(shù)據(jù)預(yù)處理,詞元化,token庫建立等,支持語言模型的訓(xùn)練和優(yōu)化
熟練使用pytorch,Tensorflow至少一種深度學(xué)習(xí)框架
掌握Prompt Tuning,P-tuning,LORA至少一種高效微調(diào)技術(shù),包括但不限于模型蒸餾,量化,剪枝等技術(shù)
在計算機視覺,多模態(tài),AIGC,機器學(xué)習(xí),渲染生成領(lǐng)域有深入的研究者