崗位職責(zé):
1.負(fù)責(zé)主流大模型(如DeepSeek、Qwen等)的本地化部署、調(diào)優(yōu)及API接口開發(fā);
基于ollama、vLLM等框架優(yōu)化大模型推理效率,提升服務(wù)性能;
2.獨(dú)立完成Dify平臺的本地化部署,并開發(fā)企業(yè)級大模型應(yīng)用;
使用RAGFlow、Llama-Factory等開源工具搭建行業(yè)解決方案;
3.參與大模型相關(guān)項(xiàng)目的全流程開發(fā),包括需求分析、代碼實(shí)現(xiàn)及文檔撰寫;
持續(xù)跟蹤大模型技術(shù)發(fā)展,探索前沿技術(shù)落地場景。
任職要求:
1.計(jì)算機(jī)/人工智能/數(shù)學(xué)相關(guān)專業(yè)本科及以上學(xué)歷,1年以上相關(guān)經(jīng)驗(yàn)(優(yōu)秀應(yīng)屆生可放寬);
2.熟悉主流大模型架構(gòu)及部署流程,能獨(dú)立完成本地環(huán)境配置與資源管理;
掌握ollama、vLLM等至少一種大模型推理框架的優(yōu)化實(shí)踐;
3.具備Dify平臺本地部署經(jīng)驗(yàn),能基于其開發(fā)企業(yè)級AI應(yīng)用;
熟練使用RAGFlow、Llama-Factory等工具解決檢索增強(qiáng)生成、模型微調(diào)等問題;
熟練掌握Python,熟悉Linux開發(fā)環(huán)境及Git版本管理;
4.有強(qiáng)烈的技術(shù)熱情,良好的邏輯思維與問題解決能力;
5.加分項(xiàng):有大模型實(shí)際項(xiàng)目開發(fā)經(jīng)驗(yàn),或熟悉LangChain、向量數(shù)據(jù)庫等技術(shù)。