工作職責(zé)
負(fù)責(zé)基于大語言模型(LLM)的AIoT應(yīng)用開發(fā),主導(dǎo)RAG(檢索增強生成)、Agent(智能體)、MCP(模型上下文協(xié)議)技術(shù)在桌面機器人、AI玩具、智能終端等場景的落地,實現(xiàn)自然語言交互、任務(wù)規(guī)劃及多模態(tài)數(shù)據(jù)處理;
設(shè)計并實現(xiàn)本地化大語言模型部署方案,結(jié)合國產(chǎn)算力平臺(如昇騰、寒武紀(jì))及邊緣計算芯片(如樂鑫ESP32-S3、瑞芯微RK3576/RK3588),完成模型量化(AWQ/GGUF)、顯存優(yōu)化(PagedAttention)及端側(cè)推理加速;
深度集成國內(nèi)云平臺(阿里云百煉、華為云昇騰AI服務(wù)、騰訊云NLP),實現(xiàn)模型服務(wù)的彈性擴展與高可用性,滿足數(shù)據(jù)合規(guī)性與安全隔離要求;
開發(fā)桌面機器人核心功能,包括舵機控制、傳感器融合、屏幕交互等,結(jié)合LLM實現(xiàn)語音問答、環(huán)境感知、行為決策等智能化能力;
與前端團(tuán)隊協(xié)作,快速構(gòu)建技術(shù)驗證Demo(如可視化對話系統(tǒng)、工具調(diào)用界面),支持產(chǎn)品原型設(shè)計與客戶演示。
任職要求
負(fù)責(zé)基于大語言模型(LLM)的AIoT應(yīng)用開發(fā),主導(dǎo)RAG(檢索增強生成)、Agent(智能體)、MCP(模型上下文協(xié)議)技術(shù)在桌面機器人、AI玩具、智能終端等場景的落地,實現(xiàn)自然語言交互、任務(wù)規(guī)劃及多模態(tài)數(shù)據(jù)處理;
設(shè)計并實現(xiàn)本地化大語言模型部署方案,結(jié)合國產(chǎn)算力平臺(如昇騰、寒武紀(jì))及邊緣計算芯片(如樂鑫ESP32-S3、瑞芯微RK3576/RK3588),完成模型量化(AWQ/GGUF)、顯存優(yōu)化(PagedAttention)及端側(cè)推理加速;
深度集成國內(nèi)云平臺(阿里云百煉、華為云昇騰AI服務(wù)、騰訊云NLP),實現(xiàn)模型服務(wù)的彈性擴展與高可用性,滿足數(shù)據(jù)合規(guī)性與安全隔離要求;
開發(fā)桌面機器人核心功能,包括舵機控制、傳感器融合、屏幕交互等,結(jié)合LLM實現(xiàn)語音問答、環(huán)境感知、行為決策等智能化能力;
與前端團(tuán)隊協(xié)作,快速構(gòu)建技術(shù)驗證Demo(如可視化對話系統(tǒng)、工具調(diào)用界面),支持產(chǎn)品原型設(shè)計與客戶演示。