職位描述:
1. 負(fù)責(zé)智慧城市場(chǎng)景下的多模態(tài)大模型研發(fā)和落地,參與大模型結(jié)構(gòu)設(shè)計(jì)、預(yù)訓(xùn)練、微調(diào)、評(píng)測(cè)及部署應(yīng)用等工作;
2. 針對(duì)數(shù)據(jù)特點(diǎn)和業(yè)務(wù)場(chǎng)景設(shè)計(jì)各類指令微調(diào)任務(wù),探索多模態(tài)大模型的Grounding、REC、OCR、VQA、Reasoning等能力;
3. 負(fù)責(zé)跟進(jìn)追蹤VLM的前沿技術(shù)方向,并進(jìn)行模型迭代、優(yōu)化和落地。
職位要求:
1. 統(tǒng)招碩士及以上學(xué)歷,3年以上視覺(jué)算法相關(guān)經(jīng)驗(yàn),在計(jì)算機(jī)視覺(jué)或多模態(tài)理解等方面有扎實(shí)的研究基礎(chǔ);
2. 熟悉 C/C++、Python,算法基礎(chǔ)扎實(shí),熟悉主流的深度學(xué)習(xí)框架(Tensorflow, PyTorch等);
3. 對(duì)多模態(tài)大模型、大語(yǔ)言模型有濃厚興趣,熟悉一種或多種主流模型原理并有自己的理解,如CLIP、BLIP系列、Kosmos系列、BeiT系列、QWen-VL、LLaVA等;
4. 優(yōu)秀的邏輯思維能力、學(xué)習(xí)能力,良好的團(tuán)隊(duì)合作和溝通能力,善于主動(dòng)發(fā)現(xiàn)問(wèn)題并積極探索;
5. 頂級(jí)學(xué)術(shù)會(huì)議上有論文發(fā)表或頂級(jí)算法比賽中取得過(guò)較好名次者優(yōu)先。