職位描述
1、負(fù)責(zé)大語(yǔ)言模型相關(guān)技術(shù)(知識(shí)注入、指令對(duì)齊、深度推理、知識(shí)圍欄等)的算法研究和應(yīng)用落地,具備自然語(yǔ)言處理、對(duì)話系統(tǒng)、語(yǔ)義理解、文本檢索,強(qiáng)化學(xué)習(xí)等方向的研發(fā)經(jīng)驗(yàn)。
2、參與對(duì)話意圖、對(duì)話管理、對(duì)話生成、人機(jī)協(xié)同、知識(shí)檢索、情感分析等場(chǎng)景的模型的訓(xùn)練和迭代,包括數(shù)據(jù)清洗、微調(diào)、測(cè)試;
3、積極探索前沿技術(shù)并結(jié)合旅游業(yè)務(wù)場(chǎng)景微調(diào)大模型,提高大模型在特定任務(wù)上的泛化效果。
4、開(kāi)展開(kāi)源大模型應(yīng)用落地探索與開(kāi)發(fā)部署,尤其是與旅游業(yè)務(wù)結(jié)合的應(yīng)用落地。
5、參與業(yè)務(wù)知識(shí)庫(kù)、大模型文本生成、智能問(wèn)答、知識(shí)圖譜等應(yīng)用構(gòu)建。
6、負(fù)責(zé)對(duì)模型進(jìn)行微調(diào)與優(yōu)化,包括主流大模型 Qwen、DeepSeek 等;使用 Dify、Langchain、Ollama 等 AI 開(kāi)發(fā)工具,運(yùn)用 LORA 等技術(shù)優(yōu)化模型性能。
7、關(guān)注大模型前沿技術(shù),跟進(jìn)業(yè)內(nèi)最新研究進(jìn)展和應(yīng)用趨勢(shì),提出創(chuàng)新思路和方向。參與對(duì)業(yè)務(wù)數(shù)據(jù)進(jìn)行挖掘,完成大模型訓(xùn)練數(shù)據(jù)集的建設(shè)等。
職位要求
1、3年及以上工作經(jīng)驗(yàn),碩士及博士研究生學(xué)歷;
2、具有良好的深度學(xué)習(xí)/自然語(yǔ)言處理/自然語(yǔ)言生成等相關(guān)理論基礎(chǔ),有 AI 產(chǎn)品或 NLP 應(yīng)用開(kāi)發(fā)經(jīng)驗(yàn)者、頂會(huì)論文發(fā)表者優(yōu)先;
3、有一定的數(shù)學(xué)建模和優(yōu)化能力,能根據(jù)具體業(yè)務(wù)設(shè)計(jì)調(diào)整模型,具有大模型的微調(diào)、增量預(yù)訓(xùn)練、對(duì)齊以及部署加速等相關(guān)經(jīng)驗(yàn);
4、熟悉BERT/lama/qwen-vl/intern-vl等主流大模型,熟悉Pytorch、TensorFlow等主流的深度學(xué)習(xí)訓(xùn)練框架,熟悉常用的大模型加速推理框架(VLLM,TensorRT-LLM)等;
5、具備AIGC、對(duì)話問(wèn)答、大模型部署、多模態(tài)模型開(kāi)發(fā)全流程(數(shù)據(jù)采標(biāo)清洗、模型設(shè)計(jì)調(diào)優(yōu)、性能評(píng)測(cè)等)、分布式訓(xùn)練及部署等經(jīng)驗(yàn)者優(yōu)先。
6、熟悉主流大模型(如 GPT、Gemini、LLaMA、Claude、DeepSeek 等)工作原理及應(yīng)用,熟悉 Dify、Langchain、Ollama 等一種或多種主流開(kāi)源 LLM/Agent 應(yīng)用開(kāi)發(fā)框架,有實(shí)際大模型調(diào)優(yōu) / 應(yīng)用經(jīng)驗(yàn)者(Prompt tuning、prefix tuning、LORA 等一種即可)優(yōu)先。
7、具有良好的團(tuán)隊(duì)協(xié)作和溝通能力,能夠解決復(fù)雜問(wèn)題,抗壓能力強(qiáng)。