ScholarGate
助手

物体识别与检测

物体识别确定图像中存在什么,而物体检测则通过边界框或区域进一步定位每个实例。

用 PaperMind 寻找选题即将推出Find papers & topics
Tools & resources
下载幻灯片
Learn & explore
视频即将推出

Definition

物体识别是将类别标签分配给图像或区域,而物体检测是定位和标注图像中每个物体实例的联合任务。

Scope

本主题涵盖图像分类、滑动窗口和区域提议检测、经典的增强级联人脸检测器,以及目前主导识别领域的卷积神经网络,同时探讨大型标注数据集和基准在推动进展中的作用。

Core questions

  • 如何确定图像中物体的类别?
  • 如何对物体进行定位和分类?
  • 哪些特征和模型能够泛化不同视角和外观?
  • 为什么学习表示超越了手工设计的特征?

Key concepts

  • 图像分类
  • 边界框检测
  • 区域提议
  • 增强级联
  • 卷积神经网络
  • 基准数据集

Key theories

增强级联检测
通过将简单的矩形特征与以级联方式排列的增强分类器相结合,实现了实时检测,该分类器能快速拒绝非物体区域,Viola-Jones人脸检测器即是其典型代表。
深度卷积识别
在大型标注数据集上训练的卷积神经网络能够端到端地学习分层视觉特征,显著提高了识别准确性,并将学习表示确立为主导方法。

Clinical relevance

识别和检测技术支持人脸识别、自动驾驶和机器人感知、医学图像诊断、内容审核和图像搜索、零售和监控分析,以及许多增强现实应用。

History

检测技术从2001年左右的手工特征和增强级联发展到基于部件的模型,2012年深度卷积网络在ImageNet上的成功引发了识别和检测领域向学习表示的快速转变。

Debates

手工特征与学习表示的对比
几十年来,识别技术一直依赖于梯度直方图等工程特征;深度学习用从数据中学习到的特征取代了这些特征,引发了关于可解释性、数据和计算需求以及鲁棒性等问题,这些问题至今仍是活跃的讨论点。

Key figures

  • Paul Viola
  • Michael Jones
  • Geoffrey Hinton

Related topics

Seminal works

  • viola2001
  • krizhevsky2012

Frequently asked questions

识别和检测有什么区别?
识别说明图像中有什么,例如它包含一只猫,而检测还说明了在哪里,通过在每只猫周围画一个框并进行标注,并且可以一次找到多个实例。
为什么深度学习极大地改善了识别?
卷积网络直接从大型标注数据集中学习相关的视觉特征,而不是依赖手工设计的特征,从而捕捉到难以手动指定的模式,并随着数据和计算能力的增长而扩展。

Methods for this concept

Related concepts