崗位職責:
1、AI服務開發(fā)與優(yōu)化:基于開源知識庫、Agent框架進行二次開發(fā),優(yōu)化大模型應用性能及功能擴展。構(gòu)建大模型服務化(MaaS),提供模型推理、微調(diào)、Prompt工程等核心能力,支持企業(yè)級業(yè)務場景接入。設(shè)計高可用、低延遲的分布式服務架構(gòu),解決模型部署、資源調(diào)度、負載均衡等工程問題;
2、開源技術(shù)二次開發(fā):基于主流開源知識庫(如FAISS、Milvus)、Agent框架(如LangChain)、AI工具鏈進行深度定制化開發(fā),滿足業(yè)務需求。優(yōu)化開源組件的性能瓶頸,解決高并發(fā)場景下的穩(wěn)定性問題;
3、算法與工程結(jié)合:針對業(yè)務場景優(yōu)化模型推理性能(如量化壓縮、動態(tài)批處理),提升服務吞吐量。開發(fā)Prompt工程模板、RAG(檢索增強生成)流程,提升模型輸出質(zhì)量;
4、系統(tǒng)架構(gòu)設(shè)計:設(shè)計可擴展的云原生架構(gòu),集成Kubernetes/Docker實現(xiàn)自動化部署與運維,構(gòu)建監(jiān)控告警系統(tǒng),保障服務SLA指標 。
任職要求:
1、本科及以上學歷,計算機科學、人工智能、軟件工程、數(shù)學等相關(guān)專業(yè)優(yōu)先;
2、具有3年以上AI開發(fā)領(lǐng)域的工作經(jīng)驗,熟悉AI服務架構(gòu)、模型開發(fā)、優(yōu)化及部署等相關(guān)工作內(nèi)容;
3、編程能力:熟悉Python編程,有深度學習和NLP模型開發(fā)經(jīng)驗;熟練掌握TensorFlow、PyTorch等深度學習框架,并有實際應用經(jīng)驗;
4、算法能力:熟練掌握Transformer/BERT/GPT等模型原理,熟悉模型部署與推理框架(如vllm、sglang等),有模型微調(diào)經(jīng)驗(LoRA微調(diào)、指令微調(diào)等),熟悉常見機器學習算法(如聚類/分類/強化學習);
5、系統(tǒng)能力:熟悉分布式系統(tǒng)設(shè)計,精通gRPC/RESTful API開發(fā) 部署;
6、項目經(jīng)驗:2年以上大模型相關(guān)開發(fā)經(jīng)驗,主導過至少2個完整AI服務落地項目;
7、軟性要求:具備強烈的技術(shù)好奇心,能快速學習新興技術(shù),優(yōu)秀的邏輯思維能力和技術(shù)問題拆解能力,適應敏捷開發(fā)流程,具備良好的跨團隊協(xié)作意識。具備良好的英語讀寫能力,能夠閱讀并理解英文技術(shù)文檔。