示范视频/图像

视频录制要求

  • 使用高清摄像机(建议 1080p 及以上分辨率)
  • 确保稳定的拍摄环境(可使用三脚架固定)
  • 保持一致的拍摄角度和光照条件
  • 建议帧率不低于 30fps

专家演示规范

  • 应包含完整任务流程
  • 每个动作需清晰可见
  • 建议从多角度拍摄关键动作
  • 可增加特写镜头展示细节操作

数据预处理

  • 视频需分割为关键帧序列
  • 建议标注时间戳和动作标签
  • 可进行图像增强处理(去噪、对比度调整)
  • 可能需要背景去除或目标检测处理

存储格式

  • 视频:MP4 或 AVI
  • 图像序列:PNG 或 JPEG
  • 配套存储元数据

动作轨迹

臂式机械臂

  1. 关节空间轨迹:记录每个时刻所有关节的角度值 (θ1, θ2, …, θn)
  2. 笛卡尔空间轨迹:记录末端执行器的位姿(位置 x, y, z 和姿态 Rx, Ry, Rz)
  3. 速度/加速度轨迹

移动机器人

  1. 位置轨迹:x, y 坐标变化
  2. 姿态轨迹:航向角变化
  3. 速度轨迹:线速度和角速度

轨迹数据获取方式

人类遥操作采集

  • 力反馈手柄
  • VR 设备控制
  • 示教器示教

仿真生成

  • 运动规划算法(RRT、PRM)
  • 物理引擎仿真(Gazebo、Unity)
  • 机器学习生成

状态-动作对

状态表示

  • 传感器数据:IMU 读数、力/力矩传感器值
  • 环境感知:RGB/RGBD 图像、激光雷达点云
  • 本体状态:关节角度、末端执行器位姿
  • 其他模态:语音指令、触觉反馈

动作表示

  • 底层控制:关节力矩指令、速度指令
  • 高层指令:笛卡尔空间末端位姿、抓取力度
  • 离散动作:开关指令、模式切换命令

数据采集规范

  • 时间同步:所有传感器需严格时间对齐(误差 <1ms)
  • 数据增强:对图像添加随机光照变化,对关节角度添加高斯噪声

语言指令

采集方式

  1. 人工编写指令
  2. 语音实时记录(语音转文字)
  3. 多语言标注

高质量指令要素

  • 对象特征(颜色、形状等视觉属性)
  • 空间关系(“左侧”、“上方”等方位词)
  • 动作细节(“缓慢拿起”、“旋转 90 度”等)
  • 环境上下文(“在厨房区域”、“避开障碍物”等)

其他

奖励函数反馈

  • 数值型分数
  • 二元反馈(成功/失败)
  • 多级评分

人类偏好比较

  • 比较两段策略执行效果
  • 常见维度:执行效率、安全程度、人性化表现

常用数据集

  • Open X-Embodiment:22 种机器人,100 万+ 轨迹
  • RoboNet
  • RLBench
  • D4RL