崗位職責:
1、大模型開發(fā)與性能優(yōu)化:負責百億至千億參數(shù)規(guī)模的大模型研發(fā),包括架構設計、訓練框架搭建、分布式訓練優(yōu)化等,提升模型訓練效率并降低計算成本。例如,基于PyTorch、DeepSpeed等工具優(yōu)化模型并行策略,解決顯存不足或通信瓶頸問題。同時需探索模型壓縮、剪枝等技術,實現(xiàn)輕量化部署。
2、前沿技術研究與工程落地跟蹤學術界與工業(yè)界最新進展(如Transformer架構改進、多模態(tài)融合技術等),復:現(xiàn)并改進論文中的算法,推動技術在實際業(yè)務場景中的應用。例如,結合RAG(檢索增強生成)技術優(yōu)化垂直領域搜索產品,或通過Fine-tuning技術適配行業(yè)需求。
3、數(shù)據(jù)處理與系統(tǒng)集成:處理大規(guī)模數(shù)據(jù)集,完成數(shù)據(jù)清洗、特征工程及增強,設計高效的數(shù)據(jù)管道以支持模型訓練。同時負責模型與生產系統(tǒng)的集成,確保其在分布式環(huán)境中穩(wěn)定運行,并通過監(jiān)控工具實時優(yōu)化性能。
4、跨團隊協(xié)作與技術支持與算法、產品、運維團隊緊密合作,將:技術方案轉化為可落地的產品功能。例如,為業(yè)務部門提供API接口或SDK支持,解決模型部署中的技術難題,并撰寫技術文檔以促進團隊協(xié)作。
任職要求:
1、碩士及以上學歷,計算機科學、人工智能、數(shù)學或相關專業(yè)優(yōu)先,重點院?;蚓邆浜M鈱W術背景者更具競爭力。
2、精通Python,熟悉PyTorch、TensorFlow等深度學習框架,具備CUDA并行計算或分布式訓練經驗。
3、深入理解NLP、預訓練模型(如GPT、BERT)及多模態(tài)技術,掌握模型微調、提示工程(Prompt Engineering)等核心方法。
4、熟悉大規(guī)模模型部署工具鏈(如Docker、Kubernetes),了解云計算平臺(AWS、阿里云)及模型服務化(Model Serving)技術。
5、需具備3年以上AI研發(fā)經驗,主導或參與過千億參數(shù)級別模型的訓練與優(yōu)化,有工業(yè)級項目落地經驗(如搜索推薦、智能客服等)者優(yōu)先。
6、能快速掌握新技術(如開源模型DeepSeek-R1),適應行業(yè)高速迭代,具備技術敏感性和創(chuàng)新思維。
7、擅長跨部門溝通,能將復雜技術方案轉化為非技術人員可理解的方案,并推動團隊高效執(zhí)行。