मशीनी अनुवाद
एक भाषा से दूसरी भाषा में पाठ का स्वचालित अनुवाद, वह क्षेत्र जिसने शब्द-संरेखण मॉडल के माध्यम से सांख्यिकीय एनएलपी (NLP) को बढ़ावा दिया और अब तंत्रिका अनुक्रम-से-अनुक्रम अनुवाद पर निर्भर करता है।
Definition
मशीनी अनुवाद किसी स्रोत भाषा से पाठ या भाषण का लक्ष्य भाषा में एक समतुल्य अभिव्यक्ति में स्वचालित रूपांतरण है।
Scope
भाषाओं के बीच स्वचालित अनुवाद को शामिल करता है: शब्द- और वाक्यांश-आधारित सांख्यिकीय मॉडल, संरेखण और नॉइज़ी-चैनल फ्रेमवर्क, ध्यान और ट्रांसफॉर्मर के साथ तंत्रिका मशीनी अनुवाद, और अनुवाद गुणवत्ता का मूल्यांकन। यह कम-संसाधन और बहुभाषी अनुवाद को संबोधित करता है। सामान्य ट्रांसफॉर्मर आर्किटेक्चर को एक संबंधित विषय में शामिल किया गया है।
Core questions
- नॉइज़ी-चैनल मॉडल अनुवाद को एक खोज समस्या के रूप में कैसे प्रस्तुत करता है?
- समानांतर कॉर्पोरा से शब्द और वाक्यांश संरेखण कैसे सीखे जाते हैं?
- तंत्रिका मशीनी अनुवाद ने वाक्यांश-आधारित प्रणालियों को कैसे पीछे छोड़ दिया?
- अनुवाद गुणवत्ता को स्वचालित रूप से और मनुष्यों द्वारा कैसे मापा जाता है?
Key concepts
- समानांतर कॉर्पस
- शब्द संरेखण
- वाक्यांश-आधारित अनुवाद
- नॉइज़ी-चैनल मॉडल
- तंत्रिका मशीनी अनुवाद
- उपशब्द इकाइयाँ
- बीएलईयू (BLEU)
- कम-संसाधन अनुवाद
Key theories
- सांख्यिकीय शब्द-संरेखण मॉडल
- ब्राउन और सहयोगियों के आईबीएम (IBM) मॉडल जो समानांतर पाठ से शब्द पत्राचार सीखते हैं और अनुवाद को संभाव्य रूप से फ्रेम करते हैं, जिससे सांख्यिकीय मशीनी अनुवाद की नींव पड़ी।
- तंत्रिका मशीनी अनुवाद
- ध्यान के साथ एंड-टू-एंड एन्कोडर-डिकोडर मॉडल जो स्पष्ट संरेखण या वाक्यांश तालिकाओं के बिना अनुवाद करते हैं, दुर्लभ शब्दों को संभालने के लिए उपशब्द इकाइयों का उपयोग करते हैं।
History
प्रारंभिक नियम-आधारित प्रणालियों की निराशाओं के बाद, ब्राउन और सहयोगियों के 1993 के आईबीएम (IBM) मॉडल ने सांख्यिकीय मशीनी अनुवाद की शुरुआत की, जिसे कोहन द्वारा प्रलेखित वाक्यांश-आधारित प्रणालियों में परिष्कृत किया गया। तंत्रिका मशीनी अनुवाद लगभग 2014-2016 के आसपास उभरा, जो तेजी से मानक बन गया और व्यापक रूप से उपयोग की जाने वाली अनुवाद सेवाओं को शक्ति प्रदान करता है।
Debates
- स्वचालित मूल्यांकन की पर्याप्तता
- बीएलईयू (BLEU) जैसे मेट्रिक्स ने तेजी से प्रगति को सक्षम किया लेकिन प्रवाह और पर्याप्तता के मानवीय निर्णयों के साथ अपूर्ण रूप से सहसंबंधित होते हैं, जिससे उच्च-दांव वाले मूल्यांकन के लिए मानवीय मूल्यांकन आवश्यक बना रहता है।
Key figures
- Peter Brown
- Robert Mercer
- Philipp Koehn
- Rico Sennrich
Related topics
Seminal works
- brown1993
- papineni2002
- sennrich2016
Frequently asked questions
- मशीनी अनुवाद एनएलपी (NLP) के इतिहास के लिए इतना महत्वपूर्ण क्यों था?
- अनुवाद ने स्पष्ट उद्देश्य, प्रचुर समानांतर डेटा और एक कठिन समस्या प्रदान की जिसने सांख्यिकीय और फिर तंत्रिका विधियों को पुरस्कृत किया, इसलिए एमटी (MT) में प्रगति ने व्यापक क्षेत्र में बार-बार प्रगति को बढ़ावा दिया।