崗位職責:
1. 研發(fā)基于圖像與感知信息的 VLA/VLM模型,提升模型在復雜場景下對視覺-語言-動作的理解與執(zhí)行能力;
2. 負責VLA/VLM 模型相關(guān)的前沿算法調(diào)研與優(yōu)化,主導數(shù)據(jù)構(gòu)建與任務驅(qū)動建模;
3. 與工程團隊密切合作,推動算法在機器人、無人機等實際系統(tǒng)中的落地應用。
崗位要求:
1. 計算機、電子工程、應用數(shù)學、自動化等相關(guān)專業(yè)碩士及以上學歷,有博士學位并在頂會/期刊發(fā)表論文者優(yōu)先;
2. 擁有 VLA/VLM模型的訓練與應用經(jīng)驗,熟悉主流深度學習框架;
3. 具備大語言模型、多模態(tài)大模型、生成式策略或世界模型等相關(guān)算法背景;
4. 熟悉端到端視覺導航及運動規(guī)劃算法者優(yōu)先;
5. 有自動駕駛或機器人領(lǐng)域 AI 算法研發(fā)經(jīng)驗者優(yōu)先。