崗位職責:
1、模型微調與優(yōu)化:參與大模型在協(xié)同辦公及建筑行業(yè)場景下的應用,包括但不限于:基于公有云大模型做局部私有資料的對接微調,基于私有大模型做垂直領域的數(shù)據(jù)抓取、自動標注、微調訓練;
2、應用落地:負責大模型的模型適配與應用落地,包括但不限于LLM、Langchain、Agent、Eval等技術;
3、性能評估監(jiān)測與部署:定期監(jiān)控模型性能,進行在特定應用場景下的各類模型能力的評估,確保模型達到業(yè)務要求,能夠進行模型的容器化部署。
任職要求:
1、參與過大模型相關開發(fā)工作,包括但不限于:數(shù)據(jù)清洗、開源模型實際微調、訓練框架開發(fā)、評測、推理部署等;
2、精通Python編程語言,熟悉Java等其他編程語言,熟悉常用框架如PyTorch,TensorFlow等深度學習框架;
3、熟悉大語言模型的增量預訓練、指令微調、偏好微調等多種訓練方法 ,有全場景訓練實戰(zhàn)落地經驗;
4、熟悉全參數(shù)、LoRA 、QLoRA 等微調方法, 有微調場景落地經驗;
5、熟悉DeepSpeed、flash-attn、vllm等大模型訓練及推理加速方法;
6、熟悉數(shù)據(jù)收集、清洗和預處理的流程。有訓練數(shù)據(jù)構造落地經驗;
7、熟悉Docker、Kubernetes等容器化技術。
8、扎實的數(shù)學功底,熟悉概率統(tǒng)計、線性代數(shù)、優(yōu)化方法等領域的相關知識 。
9、有成功優(yōu)化模型訓練算法、提升模型性能的項目經驗,能夠獨立承擔算法設計和開發(fā)任務,能獨當一面。
10、對深度學習領域的技術創(chuàng)新有敏銳的洞察力,樂于學習并積極探索新技術 。