崗位職責(zé):
1.設(shè)計(jì)和實(shí)現(xiàn)基于強(qiáng)化學(xué)習(xí)的機(jī)器人控制算法;
2.搭建和優(yōu)化仿真環(huán)境進(jìn)行模型訓(xùn)練;
3.將強(qiáng)化學(xué)習(xí)模型部署到實(shí)體機(jī)器人 ;
4.分析實(shí)驗(yàn)結(jié)果并改進(jìn)算法;
崗位要求:
1.碩士及以上學(xué)歷,計(jì)算機(jī)、控制、電子、人工智能、機(jī)械、自動(dòng)化、機(jī)器人等相關(guān)專業(yè);
2.熟悉強(qiáng)化學(xué)習(xí)(Reinforcement Learning)等基本概念;
3.熟悉編程語言(如Python、C++等),有一定的編碼能力;
4.具備一定的數(shù)學(xué)基礎(chǔ),能夠理解并應(yīng)用機(jī)器人學(xué)習(xí)算法,如如PPO、DDPG、SAC等;
5.良好的溝通能力和團(tuán)隊(duì)合作精神,能夠在實(shí)際部署中提供改進(jìn)建議。