फ़ीचर पहचान और विवरण
फ़ीचर पहचान और विवरण एक छवि में विशिष्ट स्थानीय बिंदुओं का पता लगाते हैं और उनके आसपास की उपस्थिति का सारांश प्रस्तुत करते हैं ताकि एक ही भौतिक बिंदुओं को विभिन्न छवियों में पहचाना और मिलान किया जा सके।
Definition
एक फ़ीचर एक संबद्ध डिस्क्रिप्टर वेक्टर के साथ एक विशिष्ट छवि स्थान है; पहचान ऐसे बिंदुओं को दोहराव से ढूंढती है, और विवरण तुलना के लिए उनकी उपस्थिति को एन्कोड करता है।
Scope
यह विषय कॉर्नर और ब्लब डिटेक्टरों जैसे हैरिस डिटेक्टर, स्केल-इनवेरिएंट कीपॉइंट डिटेक्शन, स्थानीय डिस्क्रिप्टर जो एक कीपॉइंट के पड़ोस को एन्कोड करते हैं, और स्केल, रोटेशन और रोशनी के प्रति अपरिवर्तनीयता को शामिल करता है जो सुविधाओं को मिलान के लिए विश्वसनीय बनाता है।
Core questions
- कौन से छवि स्थान इतने विशिष्ट और दोहराने योग्य हैं कि उनका मिलान किया जा सके?
- एक बिंदु के आसपास की स्थानीय उपस्थिति को संक्षिप्त रूप से कैसे एन्कोड किया जाता है?
- डिस्क्रिप्टर को स्केल, रोटेशन और प्रकाश के प्रति अपरिवर्तनीय कैसे बनाया जाता है?
- छवियों के बीच फ़ीचर का मिलान कैसे किया जाता है?
Key concepts
- कॉर्नर और ब्लब डिटेक्शन
- संरचना टेंसर
- स्केल-स्पेस एक्सट्रीमा
- स्थानीय डिस्क्रिप्टर
- स्केल और रोटेशन के प्रति अपरिवर्तनीयता
- फ़ीचर मिलान
Key theories
- कॉर्नर डिटेक्शन
- कॉर्नर उन स्थानों पर स्थित होते हैं जहाँ छवि की तीव्रता सभी दिशाओं में दृढ़ता से भिन्न होती है, जिसे स्थानीय ग्रेडिएंट संरचना टेंसर के आइगेनवैल्यू से पहचाना जाता है, जिससे ऐसे बिंदु मिलते हैं जो छोटे दृष्टिकोण परिवर्तनों के तहत अच्छी तरह से स्थानीयकृत और स्थिर होते हैं।
- स्केल-इनवेरिएंट फ़ीचर ट्रांसफॉर्म
- SIFT एक डिफरेंस-ऑफ-गॉसियन स्केल स्पेस में एक्सट्रीमा के रूप में कीपॉइंट का पता लगाता है और प्रत्येक को ग्रेडिएंट ओरिएंटेशन के हिस्टोग्राम द्वारा वर्णित करता है, जिससे ऐसे डिस्क्रिप्टर उत्पन्न होते हैं जो स्केल, रोटेशन और मध्यम रोशनी और दृष्टिकोण परिवर्तन के प्रति मजबूत होते हैं।
Clinical relevance
स्थानीय फ़ीचर इमेज मैचिंग, पैनोरमा स्टिचिंग, स्ट्रक्चर-फ्रॉम-मोशन और विज़ुअल लोकलाइज़ेशन, ऑब्जेक्ट इंस्टेंस रिकॉग्निशन और ऑगमेंटेड-रियलिटी ट्रैकिंग के लिए महत्वपूर्ण हैं।
History
1988 के हैरिस डिटेक्टर ने एक मजबूत कॉर्नर माप दिया, और 2004 में लोव के SIFT ने स्केल- और रोटेशन-इनवेरिएंट मैचिंग को व्यावहारिक बनाया, जिसने सीखे हुए फ़ीचर और डीप नेटवर्क के उभरने तक वाइड-बेसलाइन मैचिंग पर प्रभुत्व जमाया।
Key figures
- Chris Harris
- David Lowe
Related topics
Seminal works
- harris1988
- lowe2004
Frequently asked questions
- कॉर्नर अच्छे फ़ीचर क्यों होते हैं लेकिन सपाट क्षेत्र नहीं?
- एक कॉर्नर हर दिशा में अलग दिखता है, इसलिए इसकी स्थिति को सटीक रूप से निर्धारित किया जा सकता है और स्पष्ट रूप से मिलान किया जा सकता है, जबकि एक सपाट या समान रूप से किनारा वाला क्षेत्र स्थानांतरित होने पर समान दिखता है, जिससे इसका मिलान करना अस्पष्ट हो जाता है।
- एक डिस्क्रिप्टर को अपरिवर्तनीय होने की आवश्यकता क्यों है?
- एक ही दृश्य बिंदु तस्वीरों में विभिन्न पैमानों, घुमावों और चमक पर दिखाई देता है; एक डिस्क्रिप्टर जो उन परिवर्तनों के तहत लगभग स्थिर रहता है, बिंदु को विभिन्न छवियों में समान के रूप में पहचानने की अनुमति देता है।