職責(zé)描述:
1. 負(fù)責(zé)開源大模型算法洞察、引入與改造工作,包括模型的能力洞察、架構(gòu)設(shè)計(jì)、算法優(yōu)化、性能調(diào)優(yōu)、適配改造等;
2. 支撐LLM技術(shù)的產(chǎn)品化落地,包括但不限于智能問答、文本生成、圖像識別等;
3. 深度參與連接開源大模型與應(yīng)用場景的工作,理解應(yīng)用需求,進(jìn)行定制化技術(shù)預(yù)研;
4. 協(xié)助移植算法到ARM、GPU、CPU等目標(biāo)計(jì)算平臺;
5. 專利挖掘、知識產(chǎn)權(quán)資料編寫與申請,參與行業(yè)活動。
任職要求:
1. 計(jì)算機(jī)、電子工程、自動化、數(shù)學(xué)、物理等相關(guān)方向碩士學(xué)歷,具備Python編程能力;
2. 熟悉transformer、seq2seq等模型結(jié)構(gòu);熟練掌握常見的任一種機(jī)器學(xué)習(xí)或者深度學(xué)習(xí)框架(Tensorflow、Pytorch、Paddle等);
3. 熟悉業(yè)界主流開源大模型者,如QWen、LLaMA、ChatGLM等;
4. 在語義分析、知識圖譜、RAG、工作流等相關(guān)領(lǐng)域有深入研究或相關(guān)項(xiàng)目經(jīng)驗(yàn);
5. 具備良好的學(xué)習(xí)/溝通表達(dá)能力,較強(qiáng)的團(tuán)隊(duì)合作意識、對技術(shù)有濃厚的興趣,熱衷于追求技術(shù)極致與創(chuàng)新。
6. 有LLM大模型微調(diào)、全參數(shù)訓(xùn)練經(jīng)驗(yàn)優(yōu)先。
7. 熟悉Agent、MCP、A2A等相關(guān)技術(shù),有利用開源大模型進(jìn)行大模型調(diào)小模型API接口項(xiàng)目的實(shí)際經(jīng)驗(yàn)優(yōu)先。