vslam(GaliaLahav)

机器心脏报告

编辑:张骞

在刚刚结束的ICRA 2022上,来自美国Mission UAV团队的研究人员获得了今年导航领域的最佳论文。

机器人和自动化国际会议ICRA 2022于5月23日至27日在美国举行。这是机器人领域的顶级国际会议之一。今年大会共收到3344份投稿,其中3263份进入审查阶段,1428份被受理,受理率为43.1%。

在1428篇论文中,大会还根据航海、自动化等子赛道的特点,评选出13篇优秀论文作为相关领域的最佳研究成果进行表彰。值得一提的是,美团无人机团队的一项关于视觉里程表的研究获得了会议导航领域的年度优秀导航论文,这也是今年唯一一篇第一作者和第一单位均来自国内科技公司和高校的获奖论文。

vslam(GaliaLahav)

所有奖项链接:https://www.icra2022.org/program/awards

本文提出了一种高效的基于点和线的视觉里程计算法——edp lvo。他们证明了2D线上的3D像素是由2D线端点的反向深度决定的,这使得将光度误差扩展到该线是可行的。与团队之前的算法DPLVO相比,新算法大大减少了优化中的变量数量,并充分利用了共线性。在此基础上,他们还引入了两步优化法来加快优化速度,并证明了算法的收敛性。

vslam(GaliaLahav)

论文链接:https://www.cs.cmu.edu/~kaess/pub/Zhou22icra.pdf

实验结果表明,该算法的性能优于目前最先进的直接VO算法。这项技术将广泛应用于以无人机、自动送货车为代表的机器人自主导航,AR/VR。

什么是SLAM,VSLAM,VO?

如果把一个机器人放在未知环境中的未知位置,有没有办法让机器人在移动的同时逐渐绘制出环境的完整地图,毫无障碍地行进到房间里每一个可以到达的角落?这就是所谓的SLAM(同步定位和地图构建)问题。这里的“机器人”不仅包括传统意义上的机器人,还包括无人机和自动送货车。所以SLAM在自动驾驶、无人配送等领域应用广泛。

根据传感器的种类,SLAM可分为激光SLAM、视觉SLAM(VSLAM,传感器主要是摄像头)等类别。随着计算机视觉的快速发展,视觉SLAM以其信息量大、应用范围广、硬件成本低等优点受到广泛关注,成为许多机器人和计算机视觉应用的基本模块。

VSLAM的架构通常包括视觉里程表、后端优化、环路检测和映射等模块。其中,视觉里程计利用一个或多个摄像机在运动物体(如车辆、人、机器人)上拍摄的连续图像作为输入,从而增量估计物体本身的运动状态。视觉里程表在一些特殊的场合是非常重要和必要的,比如无法使用轮式里程表的环境(比如无人机)。

从视觉里程表的原理可以看出,由于它要处理大量的图像,其资源消耗不容小觑。但在计算资源有限、实时姿态估计的嵌入式设备中,这个问题会变得更加困难。

美团新算法解决了哪些问题?

如今,深度学习技术在各种计算机视觉任务中的表现优于传统方法。在视觉里程表方面,基于学习的方法近年来取得了很大的进展。但是,由于这些方法需要强大的GPU,它们很难在嵌入式系统上实现实时应用,传统的VSLAM和VO系统仍然是更合适的选择。

这些传统方法一般分为两类:基于特征的(间接)方法和直接方法。基于特征的方法长期以来一直是这一领域的主流。但与此同时,最新的研究表明,直接方法也可以表现出很高的准确性和鲁棒性,即使在低纹理场景中,这对基于特征的方法来说是非常具有挑战性的。所以美团的研究人员重点研究了直接VO的方法。

直接法通常使用梯度足够大的像素,通常包括线上的角点和点。如图2(a)所示,在许多人造场景中,线上的点比角多得多。用光流追踪角度是可能的,但是用同样的方法追踪直线上的点会有一些问题,因为直线上存在一维模糊。如图2(b)所示,放弃共线约束可能会导致深度估计不准确。尽管之前的研究人员已经探索过使用线来克服这个问题(如DPL VO:直接点线单目视觉里程计[2]和使用点和线的直接单目里程计[11]),但这些方法通常会显著增加优化中的计算负载。

vslam(GaliaLahav)

于是,美团的研究人员开始考虑一个问题:能否在不增加计算量的情况下,利用共线性?

因此,他们在前人工作(DPLVO [2])的基础上做了进一步的研究。并提出了一种新的算法-edplvo。

vslam(GaliaLahav)

本文的主要贡献如下:

他们将光度误差扩展到了线。原来的光度误差只针对点定义,很难应用到线。与 DPLVO 中简单地将共线约束引入成本函数不同,他们提出了一种参数化 3D 共线点的新方法,从而使得将光度误差扩展到线变得可行。具体来说,他们证明了 2D 线上任意点的 3D 点由 2D 线两个端点的逆深度决定。该属性可以显著减少变量的数量。同时,该方法在优化过程中严格满足共线约束,这提高了准确率。他们引入了一个两步骤方法来限制由于在优化中引入长期线关联而导致的计算复杂度。在每次迭代中,他们首先使用固定的逆深度和关键帧姿态来拟合 3D 线。然后,他们使用新的线参数来调节逆深度和关键帧姿态的优化结果。由此产生的两个优化问题很容易解决。研究者证明了该方法总是可以收敛的。

vslam(GaliaLahav)

作者提出的算法所生成的点云和线。作者提出的算法生成的点云和线。

实验结果表明,与现有的VO算法相比,新算法大大减少了优化的计算量,得到的结果更加准确。在TUM monoVO数据集上,在后端优化中,采用了本文提出的线性光度一致性误差+两步优化方法,比点光度一致性误差+共线约束(DPLVO)快44%。

vslam(GaliaLahav)

vslam(GaliaLahav)

vslam(GaliaLahav)

美团的技术背后隐藏着怎样的商业蓝图?

值得一提的是,在本次ICRA上,美国Mission UAV团队的另一篇关于视觉定位技术的论文也被列入了大会。这项新技术旨在帮助无人机等机器人提高执行任务时的准确性和稳定性。根据实验计算,新技术优于目前最先进的VIO算法,可以帮助无人机在纯视觉飞行中提高近30%的定位精度,大大提高其飞行安全性。

据美团无人机业务负责人介绍,美团在无人机领域的R&D布局,多是场景需求驱动。同时,近年来业务场景的快速落地也离不开技术上的突破。

据了解,美团在2017年启动了无人机配送服务的探索,目标是构建一个整合飞机、地面接收设备、航线管理后端系统的城市low 空物流网络。目前,美团已初步完成飞机(FP400系列机型)、自动化机场、无人机智能调度系统的研发,其中90%以上的零部件为纯自研。2021年初,美团无人机在深圳完成了真实用户的第一笔订单配送任务。

美团无人机目前的应用场景主要是满足消费者在城市环境下的短距离即时配送需求,比如为急救药品需求、生鲜食品需求提供3km、15min的标准服务,因此日常配送工作具有高频、短距离的特点。截至2022年5月底,美团无人机已落地深圳10个社区、4个商圈,服务覆盖近8000个家庭。累计完成真实用户订单超5.4万架,在北京、深圳等地测试机场完成飞行测试超过40万次,累计交付飞行时长超过1万小时。此外,自5月20日起,美团无人机开始在杭州运送归一化的核酸样本。截至5月25日,分发了近20万份核酸样本。

视频加载...

当然,长期来看,技术成果层出不穷,一定程度上可以反映出这家公司在以无人机为代表的机器人赛道上专注于“零售+技术”的长远思路。毫无疑问,机器人已经成为其最关键的技术的主要轨道。

美团创始人王兴之前在接受采访时也分享了相关思考。“对于美团来说,公司的业务不仅仅是移动比特,还有很多移动原子的工作。机器人技术是连接原子世界和比特世界的最重要纽带之一。”。所以在过去的几年里,美团一直在通过自研、投资、联合研发等方式不断布局机器人赛道。从自动送货车、无人机等移动机器人,到移动机械手形式的烹饪机器人、物流机器人,再到拥有软件系统的智能客服、商业大脑,美团正在构建一个机器人产品矩阵,可以满足不同应用场景的真实需求,如家庭服务、餐饮配送、终端配送、智慧零售等。

场景驱动的技术和技术养活的场景在美团形成了优势互补,美团正在形成自己独特的技术体系。

参考:https://blog.csdn.net/wb790238030/article/details/90770801

https://xw.qq.com/cmsid/20220329A0BAS000

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。系信息发布平台,仅提供信息存储空间服务。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。

本文来自网络,若有侵权,请联系删除,作者:陈同远,如若转载,请注明出处:

发表回复

登录后才能评论