自动驾驶技术的关键—行人检测算法再次刷新精度

行业动态 地图标注自动驾驶技术的关键—行人检测算法再次刷新精度已关闭评论阅读模式
地图标注

提交资料后最快2小时标注成功

我们地图标注跨界创新

试想一下,汽车的眼睛如果和人眼一样能够迅速“看”到路上的行人会怎样呢?日前,加利福尼亚大学圣迭戈分校的一位电气工程师再一次刷新了这一幕到来的可能。

行人检测技术的现状

从学术角度来说,让汽车“看”到行人,其实是应用了“行人检测”的技术。行人检测通过图像处理、计算机视觉相关算法以及机器学习等技术对道路行人进行识别和追踪,在智能车辆、自动地图标注、运动分析等领域都有着广泛的应用前景。

传统的行人检测方法主要是对目标的形状、大小、纹理等进行识别,这种方法在图像噪声较大或行人多姿势变化等场景下性能不理想。所以,目前更多被使用的是基于图像特征的行人检测算法,利用统计学原理,通过机器学习找到特征分类模型。

算法优化

16年2月,加利福尼亚大学圣迭戈分校的一位电气工程师在行人检测技术算法的优化上迈出了新的一步。他带领团队开发的行人检测系统,几乎能够进行实时(每秒2~4帧)检测,同时相较于目前已存在的系统,进一步刷新了检测精度(失误率近50%)。据了解,这种算法结合了深度学习模型,能够被用于智能车辆、机器人、以及图像视频搜索系统。

“我们致力于建立一种能够帮助电脑更好地理解它们周围的现实世界的计算机视觉系统”,努诺•瓦斯康塞洛斯(Nuno Vasconcelos)说,他是加利福尼亚大学圣迭戈分校的一位电气工程教授。他们的一大目标是使该算法实现实时追踪,尤其对于地图标注汽车的行人检测系统。

这个新的检测算法结合了深度学习模型和传统计算机视觉分类器结构,后者被学术界称为“级联分类器算法”。

级联检测与弱学习

行人检测系统通常会将一张图片分为几个小窗口,然后用一个标示行人存在的分类器,分别处理这些窗格。这种方式目前已经遭遇了瓶颈,因为行人在图像中的位置和大小(由距离相机的远近决定)会各不相同。

而在级联检测算法中,检测器的工作分为几个阶段。第一阶段,迅速识别和剔除那些明显没有行人的窗格(如蓝天等)。第二阶段,处理较难识别的窗格(如包含树木的窗格),算法可以通过特征(形状、颜色、轮廓等)检测进行识别。最后一个阶段,此时只留下最难以识别的窗格,检测器需要区分与行人非常接近的一些物体,这个过程比较缓慢,但因为在前两个阶段中已经处理了大部分窗格,所以这种方法从整体而言,其复杂度是很低的。

传统的级联检测方法依赖于“弱学习算法”(识别错误率较低),每个阶段都使用简单的分类器执行。例如,在第一阶段使用小规模弱学习算法,而在最后阶段使用大量弱学习算法。虽然这种方法很快,但是在最后阶段却难以提升识别的质量。因为弱学习算法的识别精度相同,所以就算在最后阶段叠加更多分类器,它们也无法执行更高精度的识别与分类。

深度学习模型

为了解决这个问题,瓦斯康塞洛斯和他的团队开发了一种新型算法。这种算法在级联检测的最后阶段集成了深度学习模型。深度学习模型更适合于复杂的模式识别,在被训练了成百上千次后,它们能够更好地处理图像。但是,深度学习模型对于实时检测而言过于复杂,所以目前只应用于级联检测的最后阶段。

这种解决方案,其实是一种新型的级联算法结构,它结合了不同等级的分类器:早期阶段的简单分类器(弱学习算法)以及最后阶段的复杂分类器(深度学习模型)。瓦斯康塞洛斯表示,这种方法实现起来并不烦琐,因为他们的算法会试图实现检测精度与复杂性之间的平衡。

“目前还没有哪个算法能够评估检测精度与检测速度之间的平衡。事实上,这是学术界第一次在级联检测中加入深度学习方法。基于此,我们会在实时、精准的行人检测上走得更远。”瓦斯康塞洛斯说。

该算法目前仅用于简单的二元检测任务,如行人检测。未来,研究人员致力于将这种级联算法推广于同时检测多种物体的应用中。

地图标注技术的关键—行人检测算法再次刷新精度

如何把自己的门店或公司标注到地图里面。其实很简单:



    1、先准备好门店或公司的门脸照片、名称及地址信息


    2、然后使用微信扫描下面的二维码,按照要求提交资料


    3、提交资料后,客服会联系您进行数据审核,最快2小时内上线