Imitation learning for robotics 勉強会資料(20240701)
- 14. 14
強化学習の出力(差分or座標)
ロボ制御の場合、出力は2種類
(x, y, z, roll, pitch, yaw)の
変化量を推論する
RT-1、RT-2、RT-X
(x, y, z, roll, pitch, yaw)の
移動先を推論する
こっちの方が学習しやすい。
ただし、実機の場所とAIが認識してい
る場所がどんどんずれていく。
ハンドを後少し回転さ
せて、5cm右に移動
(0.32, 025, 1.02)に移動して、
法線(0.22, 1.33, -0.2)にハン
ドの向きを合わせて