1、大語言模型研發(fā)
設(shè)計(jì)并實(shí)現(xiàn)大語言模型(LLM)的技術(shù)方案,推動其在行業(yè)客戶的垂直場景中落地應(yīng)用,包括多輪對話、文檔問答(Document QA)、結(jié)構(gòu)化信息抽取、工具調(diào)用等;
熟悉指令微調(diào)(Instruction Tuning)與LoRA訓(xùn)練,針對行業(yè)需求調(diào)整模型效果;
關(guān)注大語言模型及相關(guān)領(lǐng)域的最新研究進(jìn)展,將前沿技術(shù)應(yīng)用于模型優(yōu)化與訓(xùn)練。
2、數(shù)據(jù)分析與建模
針對多種業(yè)務(wù)場景,開展結(jié)構(gòu)化與抽象數(shù)據(jù)的建模與分析,包括時序數(shù)據(jù)預(yù)測、異常檢測、根因分析及多維數(shù)據(jù)建模;
運(yùn)用數(shù)學(xué)建模方法與深度學(xué)習(xí)算法,解決復(fù)雜數(shù)據(jù)場景中的預(yù)測與優(yōu)化問題。
3、模型訓(xùn)練調(diào)優(yōu)與部署
負(fù)責(zé)模型研發(fā)全流程,包括數(shù)據(jù)集構(gòu)建、模型訓(xùn)練調(diào)優(yōu),以及模型輕量化部署與性能優(yōu)化;
持續(xù)改進(jìn)模型表現(xiàn),提升模型的準(zhǔn)確性與泛化能力,為生產(chǎn)場景提供穩(wěn)定可靠的算法支持。
任職資格
1、至少3年算法研發(fā)經(jīng)驗(yàn),扎實(shí)的機(jī)器學(xué)習(xí)與深度學(xué)習(xí)理論基礎(chǔ);
2、熟練掌握Python或C++編程,具備獨(dú)立開發(fā)高效算法的能力;
3、熟悉主流深度學(xué)習(xí)框架(如TensorFlow、PyTorch),并具備多機(jī)多卡訓(xùn)練和模型量化部署的實(shí)際經(jīng)驗(yàn);
4、優(yōu)秀的邏輯分析能力,能夠快速定位并解決復(fù)雜問題;
5、熱愛技術(shù)創(chuàng)新,具備較強(qiáng)的學(xué)習(xí)能力和良好的團(tuán)隊(duì)協(xié)作精神。