自动驾驶训练效率高达16亿公里

研究:自动驾驶训练能够在模拟环境中以极高的效率完成

得克萨斯大学的一篇论文研究证明,强大且自然的驾驶行为完全可以通过在模拟环境中进行自我对弈以空前的规模(16亿公里驾驶)产生。这一成果得益于Gigaflow,一个批量化的模拟器,能够在单个8-GPU节点上合成并训练相当于每小时42年主观驾驶经验的数据。最终生成的策略在三个独立的自动驾驶基准测试中达到了最先进的性能。

在与人类驾驶员共同测试的真实场景中,这一策略超越了此前的最先进水平,且在训练过程中从未使用过人类数据。当与人类驾驶参考进行对比时,该策略表现出真实感,并在模拟中展现出前所未有的稳健性,平均每17.5年连续驾驶才发生一次事故。

—— arXiv预印本库

更多文章

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注