ScholarGate
دستیار

بازشناسی و تشخیص شیء

بازشناسی شیء تعیین می‌کند که چه چیزی در یک تصویر وجود دارد، و تشخیص شیء علاوه بر آن، هر نمونه را با یک کادر مرزی یا ناحیه محلی‌سازی می‌کند.

یافتن موضوع با PaperMindبه‌زودیFind papers & topics
Tools & resources
دریافت اسلایدها
Learn & explore
ویدیوبه‌زودی

Definition

بازشناسی شیء عبارت است از اختصاص برچسب‌های دسته‌بندی به تصاویر یا مناطق، و تشخیص شیء وظیفه مشترک محلی‌سازی و برچسب‌گذاری هر نمونه شیء در یک تصویر است.

Scope

این موضوع شامل طبقه‌بندی تصویر، تشخیص پنجره کشویی و پیشنهاد ناحیه، آشکارساز چهره آبشار تقویت‌شده کلاسیک، و شبکه‌های عصبی پیچشی است که اکنون بر بازشناسی تسلط دارند، همراه با نقش مجموعه داده‌های بزرگ برچسب‌گذاری‌شده و معیارهای سنجش در پیشبرد پیشرفت.

Core questions

  • چگونه دسته یک شیء در یک تصویر تعیین می‌شود؟
  • چگونه اشیاء علاوه بر طبقه‌بندی، محلی‌سازی می‌شوند؟
  • چه ویژگی‌ها و مدل‌هایی در دیدگاه و ظاهر تعمیم‌پذیر هستند؟
  • چرا نمایش‌های یادگرفته‌شده از ویژگی‌های طراحی‌شده دستی پیشی گرفتند؟

Key concepts

  • طبقه‌بندی تصویر
  • تشخیص کادر مرزی
  • پیشنهادات ناحیه
  • آبشارهای تقویت‌شده
  • شبکه‌های عصبی پیچشی
  • مجموعه داده‌های معیار

Key theories

تشخیص آبشار تقویت‌شده
تشخیص بلادرنگ با ترکیب ویژگی‌های مستطیلی ساده با یک طبقه‌بندی‌کننده تقویت‌شده که به صورت آبشاری چیده شده بود و به سرعت مناطق غیرشیء را رد می‌کرد، به دست آمد که نمونه آن آشکارساز چهره ویولا-جونز است.
بازشناسی پیچشی عمیق
شبکه‌های عصبی پیچشی آموزش‌دیده بر روی مجموعه داده‌های بزرگ برچسب‌گذاری‌شده، ویژگی‌های بصری سلسله‌مراتبی را به صورت سرتاسری یاد می‌گیرند، دقت بازشناسی را به شدت بهبود می‌بخشند و نمایش‌های یادگرفته‌شده را به عنوان رویکرد غالب تثبیت می‌کنند.

Clinical relevance

بازشناسی و تشخیص، تشخیص چهره، درک خودروهای خودران و رباتیک، تشخیص تصویر پزشکی، تعدیل محتوا و جستجوی تصویر، تحلیل خرده‌فروشی و نظارت، و بسیاری از کاربردهای واقعیت افزوده را ممکن می‌سازد.

History

تشخیص از ویژگی‌های دست‌ساز و آبشارهای تقویت‌شده در حدود سال ۲۰۰۱ به مدل‌های مبتنی بر بخش حرکت کرد، و موفقیت شبکه‌های عصبی پیچشی عمیق در ImageNet در سال ۲۰۱۲، تغییر سریعی را به سمت نمایش‌های یادگرفته‌شده در سراسر بازشناسی و تشخیص ایجاد کرد.

Debates

ویژگی‌های دست‌ساز در مقابل نمایش‌های یادگرفته‌شده
برای دهه‌ها، بازشناسی بر ویژگی‌های مهندسی‌شده مانند هیستوگرام‌های گرادیان متکی بود؛ یادگیری عمیق اینها را با ویژگی‌های یادگرفته‌شده از داده‌ها جایگزین کرد و سوالاتی را در مورد قابلیت تفسیر، الزامات داده و محاسبات، و استحکام مطرح کرد که همچنان فعال هستند.

Key figures

  • Paul Viola
  • Michael Jones
  • Geoffrey Hinton

Related topics

Seminal works

  • viola2001
  • krizhevsky2012

Frequently asked questions

تفاوت بین بازشناسی و تشخیص چیست؟
بازشناسی می‌گوید چه چیزی در یک تصویر وجود دارد، مثلاً اینکه حاوی یک گربه است، در حالی که تشخیص همچنین می‌گوید کجا، با کشیدن یک کادر در اطراف هر گربه و برچسب‌گذاری آن، و ممکن است چندین نمونه را به طور همزمان پیدا کند.
چرا یادگیری عمیق بازشناسی را تا این حد بهبود بخشید؟
شبکه‌های پیچشی ویژگی‌های بصری مرتبط را مستقیماً از مجموعه داده‌های بزرگ برچسب‌گذاری‌شده یاد می‌گیرند به جای تکیه بر ویژگی‌های طراحی‌شده دستی، الگوهایی را که به سختی می‌توان به صورت دستی مشخص کرد، ثبت می‌کنند و با داده‌ها و محاسبات مقیاس‌پذیر هستند.

Methods for this concept

Related concepts