ScholarGate
सहायक

न्यूरल भाषा मॉडल और वर्ड एम्बेडिंग

कच्चे पाठ से शब्दों और संदर्भों के सघन सदिश निरूपण सीखना — वर्ड2वेक एम्बेडिंग से लेकर BERT जैसे प्रासंगिक निरूपण तक — जो अर्थ को ज्यामिति के रूप में एन्कोड करते हैं।

PaperMind से विषय खोजेंजल्द हीFind papers & topics
Tools & resources
स्लाइड डाउनलोड करें
Learn & explore
वीडियोजल्द ही

Definition

एक वर्ड एम्बेडिंग एक शब्द के अर्थ का प्रतिनिधित्व करने वाला एक सघन वास्तविक-मूल्यवान सदिश है, जिसे इस तरह से सीखा जाता है कि वितरण संबंधी समानता सदिश-स्थान निकटता में परिलक्षित होती है; प्रासंगिक एम्बेडिंग इसे ऐसे निरूपणों तक विस्तारित करते हैं जो आसपास के पाठ पर निर्भर करते हैं।

Scope

भाषा के वितरित और न्यूरल निरूपण को शामिल करता है: वितरण परिकल्पना, वर्ड2वेक और ग्लोव जैसे स्थैतिक वर्ड एम्बेडिंग, न्यूरल भाषा मॉडल, और BERT जैसे पूर्व-प्रशिक्षित ट्रांसफार्मर से प्रासंगिक एम्बेडिंग। यह बताता है कि निरूपण को कैसे प्रशिक्षित, मूल्यांकन और डाउनस्ट्रीम कार्यों में स्थानांतरित किया जाता है। ट्रांसफार्मर वास्तुकला के विवरण और जनरेशन को एक संबंधित विषय में शामिल किया गया है।

Core questions

  • वितरण परिकल्पना क्या है और एम्बेडिंग इसे कैसे क्रियान्वित करते हैं?
  • वर्ड2वेक सह-घटना से शब्द सदिशों को कैसे सीखता है?
  • प्रासंगिक एम्बेडिंग स्थैतिक एम्बेडिंग से कैसे भिन्न होते हैं?
  • पूर्व-प्रशिक्षण और स्थानांतरण सीखने ने NLP को क्यों बदल दिया?

Key concepts

  • वितरण परिकल्पना
  • वर्ड एम्बेडिंग
  • वर्ड2वेक
  • स्किप-ग्राम
  • प्रासंगिक एम्बेडिंग
  • पूर्व-प्रशिक्षण और फाइन-ट्यूनिंग
  • स्थानांतरण सीखना
  • मास्क्ड भाषा मॉडलिंग

Key theories

वितरण परिकल्पना
यह विचार कि समान संदर्भों में आने वाले शब्दों के समान अर्थ होते हैं, जो सह-घटना सांख्यिकी से अर्थ प्राप्त करके सभी एम्बेडिंग विधियों का आधार है।
प्रासंगिक पूर्व-प्रशिक्षण
BERT की तरह, बड़े अलिखित पाठ पर गहरे द्विदिश मॉडल को पूर्व-प्रशिक्षित करना, ताकि संदर्भ-संवेदनशील निरूपण उत्पन्न हो सकें जो थोड़े फाइन-ट्यूनिंग के साथ कई डाउनस्ट्रीम कार्यों में स्थानांतरित हो सकें।

History

हैरिस की वितरण परिकल्पना को पहले गणना-आधारित सदिश-स्थान मॉडल द्वारा, फिर बेंगियो के न्यूरल भाषा मॉडल (2003) और मिकोलोव के कुशल वर्ड2वेक (2013) द्वारा क्रियान्वित किया गया था। ELMo और BERT जैसे प्रासंगिक मॉडल के 2018-2019 में आने से पूर्व-प्रशिक्षण और फाइन-ट्यूनिंग प्रमुख प्रतिमान बन गया।

Debates

एम्बेडिंग वास्तव में क्या एन्कोड करते हैं?
क्या सीखे गए निरूपण वास्तविक अर्थ संबंधी और वाक्यात्मक संरचना को कैप्चर करते हैं या केवल प्रशिक्षण डेटा में मौजूद सह-घटना नियमितताओं और पूर्वाग्रहों को, व्याख्यात्मकता के लिए एक केंद्रीय प्रश्न है।

Key figures

  • Yoshua Bengio
  • Tomas Mikolov
  • Jacob Devlin
  • Zellig Harris

Related topics

Seminal works

  • bengio2003
  • mikolov2013
  • devlin2019

Frequently asked questions

स्थैतिक और प्रासंगिक एम्बेडिंग में क्या अंतर है?
एक स्थैतिक एम्बेडिंग एक शब्द को संदर्भ की परवाह किए बिना एक निश्चित सदिश देता है, इसलिए 'बैंक' का एक ही निरूपण होता है। एक प्रासंगिक एम्बेडिंग प्रत्येक घटना के लिए एक अलग सदिश उत्पन्न करता है, जो एक नदी के किनारे को एक वित्तीय बैंक से अलग करता है।

Methods for this concept

Related concepts