基础数据采集方法(10 种)

  1. 手动录入
  2. 传感器采集
  3. 网络爬虫
  4. 数据库导出
  5. 日志采集
  6. API 调用
  7. 文件导入
  8. 图像/视频采集
  9. 语音采集
  10. RFID/NFC

遥操作(Teleoperation)

游戏手柄

  • Xbox / PlayStation

专业设备

  • 3Dconnexion
  • Force Dimension

VR 设备

  • HTC Vive
  • Manus VR

Stanford ALOHA:使用改良游戏手柄,6-DOF 控制,实现亚毫米精度

仿真采集(Simulation)

使用 Unity/Gazebo 及物理引擎。

OpenAI Dactyl:通过域随机化生成 100+ 年等效训练数据。

真人示教(Human Demonstration)

可穿戴设备(IMU、力传感器)。

工业”手把手引导”:以 100-1000Hz 采样率记录姿态。

互联网数据利用

从 YouTube、论坛、社交媒体爬取数据用于多模态 AI 训练。

数据采集指南

任务复杂度样本量
简单任务50-200 demos
中等任务500-2000
复杂任务5000+

关键:多样性(环境、物体、操作)比数量更重要。