職位描述
1、基于大模型與Agent技術(shù)理念,主導(dǎo)設(shè)計(jì)創(chuàng)新且高效的
工程架構(gòu),綜合考慮模型規(guī)模、計(jì)算資源、數(shù)據(jù)流轉(zhuǎn)以及
Agent交互邏輯等多方面因素,2、確保架構(gòu)的可擴(kuò)展性、
穩(wěn)定性與靈活性,以滿足不同業(yè)務(wù)場景下復(fù)雜多變的需
求。
3、深入研究并評(píng)估各種大模型架構(gòu)(如Transformer及
其變體)和Agent框架的優(yōu)缺點(diǎn),結(jié)合項(xiàng)目目標(biāo)與技術(shù)可
行性,制定最適合的技術(shù)選型策略,為整個(gè)研發(fā)項(xiàng)目奠定
堅(jiān)實(shí)的技術(shù)基礎(chǔ)。
4、持續(xù)對(duì)工程架構(gòu)進(jìn)行性能監(jiān)測與分析,運(yùn)用專業(yè)工具與
技術(shù)手段,精準(zhǔn)定位性能瓶頸與潛在問題,通過優(yōu)化算
法、數(shù)據(jù)結(jié)構(gòu)、系統(tǒng)配置及資源分配等方式,不斷提升架
構(gòu)的運(yùn)行效率與響應(yīng)速度。
5、跟蹤大模型與Agent領(lǐng)域的前沿技術(shù)發(fā)展趨勢,結(jié)合
實(shí)際業(yè)務(wù)需求,適時(shí)引入新技術(shù)、新方法與新工具,對(duì)現(xiàn)
有工程架構(gòu)進(jìn)行創(chuàng)新性優(yōu)化與升級(jí),以保持產(chǎn)品技術(shù)的先
進(jìn)性與前瞻性。
職位要求:
1、計(jì)算機(jī)科學(xué)、數(shù)學(xué)、統(tǒng)計(jì)學(xué)、人工智能等相關(guān)專業(yè)本科
及以上學(xué)歷
有極佳的工程實(shí)現(xiàn)能力,精通Java、Python之一。
2、有RAG、Agent的大模型項(xiàng)目落地經(jīng)驗(yàn),有多智能體
(multi-agent)架構(gòu)項(xiàng)目開發(fā)經(jīng)驗(yàn)的優(yōu)先。
3、熟悉Langchaine框架,熟練使用一項(xiàng)或多項(xiàng)大模型部署訓(xùn)練工具:llamaindex、ollama、vllm、tensorRT等。