職位描述:
1、設(shè)計和構(gòu)建結(jié)構(gòu)化的智能體知識庫,確保知識庫的結(jié)構(gòu)合理、內(nèi)容全面、質(zhì)量高。持續(xù)更新和優(yōu)化知識庫內(nèi)容,確保信息的準(zhǔn)確性和時效性;
2、根據(jù)模型訓(xùn)練需求,收集和整理所需的訓(xùn)練數(shù)據(jù),并進(jìn)行清洗、標(biāo)注和分類,確保提供高質(zhì)量、多樣性及代表性的訓(xùn)練數(shù)據(jù)支持;
3、了解數(shù)據(jù)合成策略,能根據(jù)實際情況及業(yè)務(wù)需求,設(shè)計合適的策略,在已有數(shù)據(jù)基礎(chǔ)做數(shù)據(jù)增強,支持實現(xiàn)模型目標(biāo);
4、制定數(shù)據(jù)標(biāo)注方案,并完成數(shù)據(jù)標(biāo)注任務(wù),與模型研發(fā)工程師緊密合作,支持模型訓(xùn)練和優(yōu)化;
5、分析訓(xùn)練數(shù)據(jù)的使用情況,提出優(yōu)化建議,提升智能體的訓(xùn)練效果;
6、管理訓(xùn)練數(shù)據(jù)、知識庫等內(nèi)容的版本控制和備份,確保數(shù)據(jù)安全、可追溯性及可復(fù)用;
7、編寫和維護(hù)知識庫和訓(xùn)練數(shù)據(jù)相關(guān)的文檔和報告;
8、數(shù)據(jù)安全與合規(guī):確保數(shù)據(jù)處理符合相關(guān)法律法規(guī),保護(hù)數(shù)據(jù)隱私和安全。
任職要求
1、統(tǒng)招本科及以上學(xué)歷,計算機科學(xué)、人工智能、機器學(xué)習(xí)、數(shù)據(jù)科學(xué)等相關(guān)專業(yè),985/211高校優(yōu)先;
2、有智能體或聊天機器人項目經(jīng)驗,熟悉知識圖譜、結(jié)構(gòu)化知識庫等相關(guān)技術(shù)者,有數(shù)據(jù)標(biāo)注平臺或工具開發(fā)經(jīng)驗者優(yōu)先;
3、熟悉知識庫構(gòu)建和管理工具(如Ontology、Semantic Web等),熟練掌握數(shù)據(jù)清洗、標(biāo)注和管理的工具和技術(shù)(如Python、SQL、Pandas等),具備良好的數(shù)據(jù)處理和分析能力,能夠處理大規(guī)模數(shù)據(jù)集。熟悉機器學(xué)習(xí)和自然語言處理的基本概念和流程;
4、具備良好的溝通和團隊協(xié)作能力,能夠與跨職能團隊緊密合作;
5、具備較強的學(xué)習(xí)能力和問題解決能力,能夠快速掌握新技術(shù)和新工具;
6、具備良好的文檔編寫和報告能力,能夠清晰表達(dá)復(fù)雜的技術(shù)概念。