崗位職責:
1.深入行業(yè),訓練行業(yè)大模型。
2.主導業(yè)務模型開發(fā),業(yè)務模型分析等。
3.研發(fā)人工智能在行業(yè)的落地場景。
任職要求:
統(tǒng)招本科以上學歷,數(shù)學/統(tǒng)計學相關專業(yè),3-5年以上開發(fā)工作經(jīng)驗,
1. 大模型微調(diào)和分布式訓練:
具備對開源大型預訓練模型如BERT、GPT、XLNet等進行微調(diào)的能力,以及在分布式環(huán)境中訓練模型的實踐經(jīng)驗。
能夠合理設置和調(diào)整關鍵訓練參數(shù),如學習率、批大小、epochs等,以優(yōu)化模型性能和訓練效率。
熟練使用分布式訓練框架,如Horovod、DeepSpeed等,以加速模型訓練過程。
2. 算法設計和實現(xiàn):
具備獨立設計和實現(xiàn)機器學習和深度學習算法的能力,能夠根據(jù)項目需求設計和調(diào)整模型架構,解決特定的NLP任務。
對Transformer架構有深入理解,包括自注意力機制和位置編碼,能夠根據(jù)任務需求調(diào)整模型結構。
對BERT和其變體有深入理解,能夠進行有效的預訓練模型微調(diào),以適應特定的NLP任務。
3. 廣泛的模型和算法知識:
了解并熟練應用常用的機器學習、深度學習模型和算法,包括它們的用途和適用場景。
能夠根據(jù)項目需求選擇合適的模型和算法,并進行調(diào)優(yōu)以解決特定的業(yè)務問題。
熟練掌握的模型和算法包括但不限于線性回歸、邏輯回歸、SVM、KNN、前饋神經(jīng)網(wǎng)絡、CNN、RNN、LSTM等。
4. 大模型開發(fā):
具有自然語言處理、檢索增強生成、智能代理等領域的理論基礎和實踐經(jīng)驗。