一、崗位職責(zé):
負(fù)責(zé)垂直行業(yè)大模型的設(shè)計(jì)、訓(xùn)練、調(diào)優(yōu)與部署;
研究并實(shí)現(xiàn)面向特定行業(yè)的預(yù)訓(xùn)練和微調(diào)方法,提升模型在具體場(chǎng)景下的性能;
構(gòu)建高質(zhì)量的行業(yè)數(shù)據(jù)集,完成數(shù)據(jù)清洗、標(biāo)注、增強(qiáng)等工作;
參與模型壓縮、蒸餾、量化、推理加速等優(yōu)化工作;
與部門經(jīng)理、業(yè)務(wù)團(tuán)隊(duì)協(xié)作,推動(dòng)AI模型在實(shí)際業(yè)務(wù)中的落地應(yīng)用;
跟蹤前沿研究,持續(xù)優(yōu)化模型效果,提升系統(tǒng)整體智能化水平。
二、任職要求:
教育背景:
計(jì)算機(jī)科學(xué)、人工智能、數(shù)學(xué)、電子工程等相關(guān)專業(yè);
技術(shù)能力:
精通Python編程語(yǔ)言,熟悉TensorFlow/PyTorch等深度學(xué)習(xí)框架;
熟悉Transformer架構(gòu)及各類預(yù)訓(xùn)練模型(如BERT、GPT、LLaMA、ChatGLM等);
有大規(guī)模語(yǔ)言模型訓(xùn)練、微調(diào)、評(píng)估經(jīng)驗(yàn),掌握LoRA、Adapter、Prompt Tuning等參數(shù)高效訓(xùn)練方法;
熟悉分布式訓(xùn)練技術(shù)(如DeepSpeed、Megatron-LM、Horovod等),具備多GPU/TPU集群使用經(jīng)驗(yàn);
具備良好的算法基礎(chǔ)和扎實(shí)的機(jī)器學(xué)習(xí)/深度學(xué)習(xí)理論功底;
熟悉常見的模型評(píng)估指標(biāo)(BLEU、ROUGE、F1、AUC等)和調(diào)優(yōu)策略;
有數(shù)據(jù)處理、文本生成、對(duì)話系統(tǒng)、知識(shí)融合、意圖理解等相關(guān)項(xiàng)目經(jīng)驗(yàn)者優(yōu)先。
工程能力:
熟悉Linux環(huán)境開發(fā),了解Docker、Kubernetes等容器化部署工具;
有將模型部署上線的實(shí)際經(jīng)驗(yàn),熟悉ONNX、Triton、TensorRT等推理引擎者優(yōu)先;
有良好的代碼規(guī)范和文檔習(xí)慣,具備一定的工程交付能力。
項(xiàng)目經(jīng)驗(yàn):
至少參與過(guò)2個(gè)以上完整的大模型訓(xùn)練或調(diào)優(yōu)項(xiàng)目,有從0到1構(gòu)建模型的經(jīng)驗(yàn);
有垂直行業(yè)(如金融、醫(yī)療、教育、政務(wù)等)模型定制化訓(xùn)練經(jīng)驗(yàn)者優(yōu)先;
軟技能:
具備良好的溝通能力和團(tuán)隊(duì)合作精神;
對(duì)AI技術(shù)有強(qiáng)烈興趣,關(guān)注行業(yè)動(dòng)態(tài),有自我驅(qū)動(dòng)力;
能夠獨(dú)立思考并解決復(fù)雜問(wèn)題,具備較強(qiáng)的邏輯思維能力;
英文文獻(xiàn)閱讀能力強(qiáng),能快速?gòu)?fù)現(xiàn)最新研究成果。
三、加分項(xiàng):
有NLP、CV、語(yǔ)音識(shí)別或跨模態(tài)研究背景者優(yōu)先。
熟悉Agent、RAG、檢索增強(qiáng)生成、多模態(tài)模型等技術(shù);
有開源社區(qū)貢獻(xiàn)經(jīng)歷(如HuggingFace、GitHub等);
熟悉AutoML、超參調(diào)優(yōu)、模型監(jiān)控、A/B測(cè)試等全流程;