RL机器人控制面临的问题

  1. RL机器人问题,是连续高维动作和状态空间
  2. RL机器人控制三个方面问题:
    • 数据效率
    • 探索与利用
    • 泛化性和可复现性
  3. 数据效率低
    • 提高数据效率的方法之一是收集更多的数据和更有效地使用目前拥有的数据
    • 收集更多数据的方法之一是并行地运行多个机器人来收集数据
  4. 探索与利用
    • 真实机器人进行探索,可能会损伤机器人
    • 同策略方法中探索性取决于初始的条件和训练过程。在训练策略的过程,可能会注重于利用
  5. 泛化性和可复现性
    • 当前的某些算法只注重于某一种任务,而到了另一种任务的时候需要重新调节参数
    • 随机种子数影响着能否复现成功