2020年8月,全球计算机三大顶级会议之一ECCV 2020以线上的形式正式举行,深兰科技DeepBlueAI团队包揽了GigaVision 2020挑战赛图像多类别目标检测和视频多目标跟踪双赛道冠军,有力推动了十亿级像素图像和视频的目标检测技术的发展。此外,还在VIPrios系列赛、Visdrone系列赛中获得了2个亚军和4个季军,一举囊括8个大奖。值得一提的是,该团队在由谷歌于Kaggle平台上举办的ECCV挑战赛Google Landmark Retrieval 2020上也收获了一枚金牌。至此,深兰科技以在ICCV、CVPR和ECCV上分别取得了多个第一的优异战绩,实现了全球三大计算机视觉顶级会议挑战赛的大满贯。
此次深兰科技获得双冠的GigaVision 2020挑战赛,是由清华大学基于其新推出的数据集PANDA而组织的,PANDA是全球首个十亿像素级别视频数据集。过去十年中,行人检测、跟踪、动作识别、异常检测、属性识别等以人为中心的计算机视觉分析任务引起了人们的极大关注,为了促进新的算法来理解大规模现实世界场景中复杂的人群活动及社交行为,可将图像放大千倍的十亿级别像素目标检测,将在例如人脸识别、无人驾驶、监控安防和智能手机等多个领域被广泛应用。
GigaVision 2020挑战赛的任务为两类经典的视觉任务:图像多类别目标检测和视频多目标跟踪,任务一为行人和车辆检测,任务二则需要提取行人在视频中的轨迹。在PANDA上进行检测必须同时解决准确性和效率问题,准确性受到明显的目标尺度变化和复杂遮挡的挑战,而效率则受到十亿像素级别分辨率的极大影响。同时,巨大的同类目标尺度变化、对长时间长距离追踪的需求和行人拥挤、相互遮挡的复杂场景更带来了严峻挑战。深兰科技DeepBlueAI团队在检测赛道将任务解耦为多个子任务,把难点独立出来重点解决,并根据以往检测经验,通过所积累的模块和方法,使得结果有了进一步的提升。最终,第二、三名只有千分之几的分差,而DeepBlueAI团队的最好成绩领先第二名2.6个百分点,强势获得冠军。
计算机视觉作为深兰科技的核心技术之一,其实力已在多项国际顶会竞赛中得以验证,并已应用于不同领域的产品中,包括疫情期间发挥了极大作用的深兰AI热感视觉行为监控系统-猫头鹰,在广州、深圳、武汉、上海、长沙等多地获得自动驾驶路测牌照的熊猫智能公交车,以及各类机器人和智能零售产品等。基础研究和算法的领先,将直接影响产品的性能,关系到人工智能的落地应用,为此,深兰科技将在致力“人工智能,服务民生”的愿景下一往无前。