心流logo

Hugging Face发布自动驾驶大规模数据集 端到端学习模型将如何改变自动驾驶发展? 开源数据集对自动驾驶技术发展有何意义? 实际道路测试将面临哪些挑战?

项目背景

去年,人工智能开发平台Hugging Face(Hugging Face)推出了LeRobot平台,这是一个开放的人工智能模型、数据集和工具的集合,旨在帮助构建实际的机器人系统。周二,Hugging Face与人工智能初创公司Yaak(Yaak)合作,为LeRobot平台扩展了一个新的训练数据集,用于帮助机器人和汽车在城市街道等环境中实现自主导航。

数据集特点

这个名为"学习驾驶"(Learning to Drive,L2D)的新数据集容量超过1PB,包含了来自德国驾校车辆上安装的传感器数据。L2D捕获了驾驶教练和学员在建筑工地、十字路口、高速公路等各种场景下驾驶时的摄像头、GPS和"车辆动态"数据。

目前市面上已有包括Alphabet(Alphabet)旗下Waymo(Waymo)和Comma AI(Comma AI)在内的多家公司发布的开源自动驾驶训练数据集。这些数据集大多侧重于规划任务。这类任务需要高质量标注,因此难以扩展。

相比之下,L2D的创建者表示,该数据集旨在支持"端到端"学习的开发,这有助于直接从传感器输入(如摄像头画面)预测行为(如行人何时可能过马路)。

未来规划

Yaak联合创始人哈西姆拉特·桑德瓦利亚(Harsimrat Sandhawalia)和Hugging Face机器人人工智能团队成员雷米·卡登(Remi Cadene)在博客中写道:"人工智能社区现在可以构建端到端的自动驾驶模型。L2D致力于成为最大的开源自动驾驶数据集,为人工智能社区提供独特且多样化的'场景',用于训练端到端空间智能。"

Hugging Face和Yaak计划在今年夏天对使用L2D和LeRobot训练的模型进行实际的"闭环"测试,测试将在配备安全驾驶员的车辆上进行。两家公司呼吁人工智能社区提交他们希望评估的模型和任务,如环岛导航和停车等场景。