崗位職責(zé):
1、結(jié)合實(shí)際業(yè)務(wù)場景,規(guī)劃設(shè)計(jì)AI產(chǎn)品中智能語言理解交互的技術(shù)方案;
2、負(fù)責(zé)大語言模型及多模態(tài)大模型的研發(fā)與優(yōu)化,包括但不限于模型訓(xùn)練調(diào)優(yōu)、推理加速等工作,提升模型在政務(wù)相關(guān)場景的性能;
3、負(fù)責(zé)跟進(jìn)領(lǐng)域最新進(jìn)展,探索將前沿的算法應(yīng)用于實(shí)際業(yè)務(wù),包括不僅限于Agent、多輪對話、圖像識(shí)別的研發(fā)落地工作。
崗位要求:
1、本科及以上學(xué)歷,三年以上工作經(jīng)驗(yàn),計(jì)算機(jī)相關(guān)專業(yè),深刻理解計(jì)算機(jī)原理,有良好的數(shù)據(jù)結(jié)構(gòu)和算法基礎(chǔ),有扎實(shí)的編程能力;
2、對傳統(tǒng)和前沿的NLP/LLM、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘等相關(guān)技術(shù)都有深刻的了解和相關(guān)項(xiàng)目經(jīng)驗(yàn)(包括但不限于Transformer、BERT、GPT等),對DeepSeek-R1所使用技術(shù)有較深理解或者實(shí)踐者優(yōu)先;
3、對CV領(lǐng)域有深入的理解,在多模態(tài)模型(LLaVa、InternVL、Qwen2.5-VL等)有深入的研究經(jīng)歷者優(yōu)先;
4、具有在大模型訓(xùn)練、微調(diào)方面的實(shí)戰(zhàn)經(jīng)驗(yàn),熟練使用Python或者C++等編程語言,熟悉主流深度學(xué)習(xí)框架(如PyTorch、TensorFlow等),具有較強(qiáng)的算法工程落地能力和經(jīng)驗(yàn);
5、有大模型推理加速經(jīng)驗(yàn)者優(yōu)先,包括但不限于vLLM、SGLang等;
6、熟悉Al Agent的原理和應(yīng)用,有相關(guān)項(xiàng)目開發(fā)經(jīng)驗(yàn)者優(yōu)先;
7、學(xué)習(xí)能力強(qiáng),邏輯思維清晰,較強(qiáng)的文獻(xiàn)閱讀能力,有較強(qiáng)的自我驅(qū)動(dòng)力和問題解決能力,有軟件工程能力者優(yōu)先;
8、要求抗壓能力強(qiáng),樂于主動(dòng)分享和溝通技術(shù)。