导读:目前新检测器在自动驾驶领域权威数据集KITTI BEV排行榜上排名第一。
阿里巴巴在自动驾驶领域取得新突破。
3月19日,阿里巴巴达摩院宣布近日有论文入选计算机视觉顶会CVPR 2020.论文提出一个通用、高性能的自动驾驶检测器,可兼顾3D物体的检测精度和速度,提升自动驾驶系统安全性能,两者兼得的实现在业界尚属首次。
该论文团队表示,检测器的创新是自动驾驶领域落地的关键突破口,此次提出的检测器融合了单阶段检测器和两阶段检测器的优势,因此同时实现了3D检测精读和速度的提升,未来检测器的创新研究还可以解决自动驾驶产业的更多难题。其团队作者均来自阿里巴巴达摩院,第一作者为达摩院研究实习生Chenhang He,其他作者还包括达摩院高级研究员、IEEE Fellow华先胜,达摩院高级研究员、IEEE Fellow张磊等。
据了解,自动驾驶检测器是自动驾驶具备感知能力的核心组件,检测器需要快速处理、分析传感器、激光雷达等采集的多维信息,使车辆识别周围环境物体,并对物体在三维空间中的位置进行精准定位,这个过程需要3D目标检测的辅助。
与使用RGB图像进行目标检测,以输出物体类别和在图像上2D bounding box的2D检测方式不同,3D目标检测需要使用RGB图像、RGB-D深度图像和激光点云的方式来实现,最终输出物体类别及在三维空间中的长宽高、旋转角等信息。
对于自动驾驶而言,其需要从现实世界中估计更具信息量的3D边界框,以完成诸如路径规划和避免碰撞之类的高级任务。为确保自动驾驶的安全,3D检测的精度和速度缺一不可。但就目前两种基于点云的3D物体检测的主要架构而言,单阶段检测器和两阶段检测器尚无法能兼顾两项指标。
对此,达摩院在论文中提出在训练中利用一个辅助网络来解决以上问题。具体而言,其能够将单阶段检测器中的体素特征转化为点级特征,并施加一定的监督信号,从而使卷积特征也具有结构感知能力,进而提高检测精度。与此同时,在做模型推断时,辅助网络并不参与计算(detached),单阶段检测器的检测效率得以保证。
此外,达摩院还提出工程上的改进,Part-sensitive Warping (PSWarp), 用于处理单阶段检测器中存在的“框-置信度-不匹配”问题。
目前,该检测器在自动驾驶领域权威数据集KITTI BEV排行榜上排名第一。测试结果显示,在自动驾驶领域权威数据集KITTI BEV排行榜上,该检测器排名第一,精度超过其他单阶段检测器,检测速度也达到25FPS ,是目前排名第二方案的两倍多。
相较于百度和腾讯,阿里巴巴在自动驾驶领域一直颇为低调。自2018年4月宣布布局自动驾驶后,鲜有声音对外发出。在技术路线上,阿里巴巴选择L4级自动驾驶道路,并试图以协同智能的方式降低自动驾驶现有方案的物理困境和成本障碍,该研究由AI实验室首席科学家王刚亲自带队。去年9月的云栖大会上,阿里巴巴集团首席技术官(CTO)兼阿里云智能总裁张建锋称,达摩院的自动驾驶已达到L4级水平,但未有更多信息流出。
此次对外发声,或许意味着阿里巴巴将在该领域更多发力。