崗位職責(zé):
1.負責(zé)開發(fā)用于承載大模型的高效訓(xùn)練、推理平臺,并結(jié)合特點進行算法與實現(xiàn)的優(yōu)化;
2.負責(zé)大模型(CV、NLP、多模態(tài)等方向)技術(shù)方案的實現(xiàn)和效果評估,跟進前沿AI大模型研究與效果性能調(diào)優(yōu);
3.推進分布式訓(xùn)練中的計算和通信優(yōu)化,充分利用算力,使用大量加速卡探索性能邊界。
任職資格:
1.計算機相關(guān)專業(yè)碩士及以上學(xué)歷;
2.熟悉Linux開發(fā)環(huán)境,至少掌握Python、Java、C++等開發(fā)語言中的一種,熟悉Pytorch/TensorFlow/MindSpore/huggingface中的一種;
3.數(shù)學(xué)基礎(chǔ)扎實,熟悉深度學(xué)習(xí)與分布式算法,能夠清晰理解算法基本原理及實現(xiàn)方法,有大規(guī)模分布式算法相關(guān)開發(fā)經(jīng)驗者優(yōu)先;
4.有過深度學(xué)習(xí)平臺開發(fā)或大模型開發(fā)相關(guān)經(jīng)驗者優(yōu)先。