崗位職責(zé):
1、開發(fā)、訓(xùn)練和部署用于運(yùn)動和操作任務(wù)的強(qiáng)化學(xué)習(xí)算法;
2、構(gòu)建模擬基礎(chǔ)設(shè)施,支持大規(guī)模通用人形機(jī)器人運(yùn)動和操縱策略的訓(xùn)練;
3、與控制團(tuán)隊(duì)合作,將策略集成到現(xiàn)有的控制堆棧中;
4、定義、測試和評估學(xué)習(xí)策略的性能指標(biāo)等。
任職要求:
1、本科及以上學(xué)歷,計(jì)算機(jī)、軟件工程、自動化、電子信息、機(jī)械等相關(guān)專業(yè);
2、熟練使用PyTorch編寫生產(chǎn)質(zhì)量代碼;
3、熟悉在線和離線強(qiáng)化學(xué)習(xí)算法如PPO,SAC等;
4、熟悉常見的RL技術(shù),例如:領(lǐng)域隨機(jī)化、課程學(xué)習(xí)、獎勵塑造等,具有調(diào)整這些RL算法的超參數(shù)和成本函數(shù)的經(jīng)驗(yàn);
5、熟悉通用ML評估工具,例如 TensorBoard、Weights&Biases等;擁有訓(xùn)練雙足機(jī)器人運(yùn)動策略經(jīng)驗(yàn)者優(yōu)先。