基础数据采集方法(10 种)
- 手动录入
- 传感器采集
- 网络爬虫
- 数据库导出
- 日志采集
- API 调用
- 文件导入
- 图像/视频采集
- 语音采集
- RFID/NFC
遥操作(Teleoperation)
游戏手柄
- Xbox / PlayStation
专业设备
- 3Dconnexion
- Force Dimension
VR 设备
- HTC Vive
- Manus VR
Stanford ALOHA:使用改良游戏手柄,6-DOF 控制,实现亚毫米精度
仿真采集(Simulation)
使用 Unity/Gazebo 及物理引擎。
OpenAI Dactyl:通过域随机化生成 100+ 年等效训练数据。
真人示教(Human Demonstration)
可穿戴设备(IMU、力传感器)。
工业”手把手引导”:以 100-1000Hz 采样率记录姿态。
互联网数据利用
从 YouTube、论坛、社交媒体爬取数据用于多模态 AI 训练。
数据采集指南
| 任务复杂度 | 样本量 |
|---|---|
| 简单任务 | 50-200 demos |
| 中等任务 | 500-2000 |
| 复杂任务 | 5000+ |
关键:多样性(环境、物体、操作)比数量更重要。