工作職責(zé):
1.參與大規(guī)模預(yù)訓(xùn)練語言模型的研發(fā)工作, 包括模型設(shè)計、數(shù)據(jù)集構(gòu)建、超參數(shù)優(yōu)化等;
2.研究和實現(xiàn)機器學(xué)習(xí)等相關(guān)技術(shù),不斷提升大模型Agent應(yīng)用的性能和用戶體驗;
3.追蹤學(xué)術(shù)界和工業(yè)界大模型最近的研究和應(yīng)用, 在大模型預(yù)訓(xùn)練、有監(jiān)督微調(diào)、增強學(xué)習(xí)等方向的算法、數(shù)據(jù)、評測等維度進行持續(xù)的創(chuàng)新和優(yōu)化;
4.參與算法和技術(shù)方案設(shè)計以及專利編寫。
任職要求:
1.相關(guān)專業(yè)碩士以上學(xué)歷, 如人工智能、數(shù)學(xué)、計算機、軟件工程等;
2.熟練使用Python進行代碼開發(fā),熟悉LLM全流程的工作原理;
3.熟悉常用LLM,如ChatGPT,Claude,DeepSeek,Qwen等,熟悉LLM本地化部署,包括英偉達、華為芯片等部署環(huán)境;
4.熟悉AIGC的前沿應(yīng)用,有Agent、MCP等相關(guān)開發(fā)經(jīng)驗,了解目前LLM領(lǐng)域的前沿趨勢;
5.對大語言模型有著強烈的熱愛和興趣,并看好這個方向的發(fā)展。