崗位職責(zé)?:
大模型安裝部署:負(fù)責(zé)將各類先進(jìn)的大模型,如大語言模型、圖像識別模型等,高效安裝部署到基于華為昇騰技術(shù)的國產(chǎn)化 AI 算力平臺上。優(yōu)化模型部署流程,確保模型在昇騰硬件系統(tǒng)中穩(wěn)定、高速運(yùn)行,為后續(xù)應(yīng)用提供堅(jiān)實(shí)基礎(chǔ)。?
模型微調(diào)優(yōu)化:根據(jù)不同行業(yè)和業(yè)務(wù)場景需求,運(yùn)用專業(yè)知識和技術(shù)對已部署的大模型進(jìn)行精準(zhǔn)微調(diào)。深入研究模型架構(gòu)和參數(shù),結(jié)合實(shí)際數(shù)據(jù),通過微調(diào)使模型性能顯著提升,更好地滿足特定任務(wù)要求。?
國產(chǎn)化 AI 算力適配:針對華為昇騰技術(shù)的硬件特性,對 AI 模型進(jìn)行深度適配和優(yōu)化。包括但不限于對昇騰芯片的指令集優(yōu)化、內(nèi)存管理優(yōu)化以及多卡并行計(jì)算的適配,充分挖掘昇騰算力潛力,實(shí)現(xiàn)模型性能最大化。?
測試與維護(hù):對安裝部署及微調(diào)后的模型進(jìn)行全面、嚴(yán)格的測試,監(jiān)測模型在不同場景下的運(yùn)行表現(xiàn),及時(shí)發(fā)現(xiàn)并解決潛在問題。定期對模型和算力平臺進(jìn)行維護(hù)和更新,保障系統(tǒng)的長期穩(wěn)定運(yùn)行和性能優(yōu)化。
招聘要求:
1、學(xué)歷要求:本科三年以上;
2:工作經(jīng)歷:熟悉華為昇騰技術(shù);做過國產(chǎn)化AI算力適配;
3:能接受出差,出差地鹽城