بازشناسی و تشخیص شیء
بازشناسی شیء تعیین میکند که چه چیزی در یک تصویر وجود دارد، و تشخیص شیء علاوه بر آن، هر نمونه را با یک کادر مرزی یا ناحیه محلیسازی میکند.
Definition
بازشناسی شیء عبارت است از اختصاص برچسبهای دستهبندی به تصاویر یا مناطق، و تشخیص شیء وظیفه مشترک محلیسازی و برچسبگذاری هر نمونه شیء در یک تصویر است.
Scope
این موضوع شامل طبقهبندی تصویر، تشخیص پنجره کشویی و پیشنهاد ناحیه، آشکارساز چهره آبشار تقویتشده کلاسیک، و شبکههای عصبی پیچشی است که اکنون بر بازشناسی تسلط دارند، همراه با نقش مجموعه دادههای بزرگ برچسبگذاریشده و معیارهای سنجش در پیشبرد پیشرفت.
Core questions
- چگونه دسته یک شیء در یک تصویر تعیین میشود؟
- چگونه اشیاء علاوه بر طبقهبندی، محلیسازی میشوند؟
- چه ویژگیها و مدلهایی در دیدگاه و ظاهر تعمیمپذیر هستند؟
- چرا نمایشهای یادگرفتهشده از ویژگیهای طراحیشده دستی پیشی گرفتند؟
Key concepts
- طبقهبندی تصویر
- تشخیص کادر مرزی
- پیشنهادات ناحیه
- آبشارهای تقویتشده
- شبکههای عصبی پیچشی
- مجموعه دادههای معیار
Key theories
- تشخیص آبشار تقویتشده
- تشخیص بلادرنگ با ترکیب ویژگیهای مستطیلی ساده با یک طبقهبندیکننده تقویتشده که به صورت آبشاری چیده شده بود و به سرعت مناطق غیرشیء را رد میکرد، به دست آمد که نمونه آن آشکارساز چهره ویولا-جونز است.
- بازشناسی پیچشی عمیق
- شبکههای عصبی پیچشی آموزشدیده بر روی مجموعه دادههای بزرگ برچسبگذاریشده، ویژگیهای بصری سلسلهمراتبی را به صورت سرتاسری یاد میگیرند، دقت بازشناسی را به شدت بهبود میبخشند و نمایشهای یادگرفتهشده را به عنوان رویکرد غالب تثبیت میکنند.
Clinical relevance
بازشناسی و تشخیص، تشخیص چهره، درک خودروهای خودران و رباتیک، تشخیص تصویر پزشکی، تعدیل محتوا و جستجوی تصویر، تحلیل خردهفروشی و نظارت، و بسیاری از کاربردهای واقعیت افزوده را ممکن میسازد.
History
تشخیص از ویژگیهای دستساز و آبشارهای تقویتشده در حدود سال ۲۰۰۱ به مدلهای مبتنی بر بخش حرکت کرد، و موفقیت شبکههای عصبی پیچشی عمیق در ImageNet در سال ۲۰۱۲، تغییر سریعی را به سمت نمایشهای یادگرفتهشده در سراسر بازشناسی و تشخیص ایجاد کرد.
Debates
- ویژگیهای دستساز در مقابل نمایشهای یادگرفتهشده
- برای دههها، بازشناسی بر ویژگیهای مهندسیشده مانند هیستوگرامهای گرادیان متکی بود؛ یادگیری عمیق اینها را با ویژگیهای یادگرفتهشده از دادهها جایگزین کرد و سوالاتی را در مورد قابلیت تفسیر، الزامات داده و محاسبات، و استحکام مطرح کرد که همچنان فعال هستند.
Key figures
- Paul Viola
- Michael Jones
- Geoffrey Hinton
Related topics
Seminal works
- viola2001
- krizhevsky2012
Frequently asked questions
- تفاوت بین بازشناسی و تشخیص چیست؟
- بازشناسی میگوید چه چیزی در یک تصویر وجود دارد، مثلاً اینکه حاوی یک گربه است، در حالی که تشخیص همچنین میگوید کجا، با کشیدن یک کادر در اطراف هر گربه و برچسبگذاری آن، و ممکن است چندین نمونه را به طور همزمان پیدا کند.
- چرا یادگیری عمیق بازشناسی را تا این حد بهبود بخشید؟
- شبکههای پیچشی ویژگیهای بصری مرتبط را مستقیماً از مجموعه دادههای بزرگ برچسبگذاریشده یاد میگیرند به جای تکیه بر ویژگیهای طراحیشده دستی، الگوهایی را که به سختی میتوان به صورت دستی مشخص کرد، ثبت میکنند و با دادهها و محاسبات مقیاسپذیر هستند.