崗位職責(zé):
1. 參與研發(fā)企業(yè)級AI中臺系統(tǒng),開發(fā)高性能RAG系統(tǒng)和大語言模型相關(guān)調(diào)優(yōu),推動核心場景的解決方案落地;
2. 構(gòu)建面向多行業(yè)的智能決策系統(tǒng),研發(fā)企業(yè)級供應(yīng)鏈AI Agent體系,調(diào)優(yōu)多智能體協(xié)同的調(diào)度系統(tǒng),并將其融入到標(biāo)準(zhǔn)產(chǎn)品;
3. 建設(shè)自動化模型部署,實現(xiàn)算力監(jiān)控、多模態(tài)模型推理框架整合調(diào)度系統(tǒng)的構(gòu)建;
4. 推進(jìn)大模型輕量化技術(shù)在邊緣端應(yīng)用,熟悉模型蒸餾壓縮、邊緣設(shè)備適配及推理性能優(yōu)化;
5. 參與業(yè)務(wù)系統(tǒng)集成方案設(shè)計,完成第三方系統(tǒng)對接、異構(gòu)數(shù)據(jù)融合及全鏈路調(diào)優(yōu)。
崗位要求:
1、碩士及以上學(xué)歷,計算機(jī)科學(xué)、數(shù)學(xué)或相關(guān)專業(yè),3年以上相關(guān)工作經(jīng)驗。
2、熟練掌握Python、C++等編程語言和PyTorch、TensorFlow、Mindspore等深度學(xué)習(xí)框架。
3、精通Transformer/BERT/GPT/MoE等大模型網(wǎng)絡(luò)架構(gòu),掌握LoRA/Adapter/SFT等微調(diào)技術(shù),掌握PyTorch/TensorFlow框架。
4、具備模型蒸餾/ONNX轉(zhuǎn)換/量化壓縮實戰(zhàn)經(jīng)驗,熟悉TensorRT/vLLM等開源推理引擎或優(yōu)化技術(shù)。
5、熟悉模型推理部署相關(guān)封裝技術(shù),如Docker容器化部署及CI/CD流水線設(shè)計。
6、積極擁抱開源,有良好的自我學(xué)習(xí)能力,及自驅(qū)力。細(xì)致,耐心。具備良好的問題解決能力和團(tuán)隊合作精神。
7、熟悉Ascend相關(guān)技術(shù)棧者優(yōu)先。