Machine learningDeep learning / NLP / CV

डोमेन-अनुकूलनीय सुदृढीकरण अधिगम

डोमेन-अनुकूलनीय सुदृढीकरण अधिगम (DARL) मानक RL का विस्तार करता है, जिससे एक वातावरण या डोमेन में प्रशिक्षित नीति को एक भिन्न लेकिन संबंधित लक्ष्य डोमेन में प्रभावी ढंग से स्थानांतरित और सामान्यीकृत किया जा सकता है। यह डोमेन-शिफ्ट समस्या का समाधान करता है — जहाँ प्रशिक्षण और परिनियोजन के बीच गतिकी, अवलोकन या पुरस्कार संरचनाएँ भिन्न होती हैं — संरेखण, अनुकूलन, या डोमेन-यादृच्छिकीकरण तकनीकों के माध्यम से, लक्ष्य डोमेन में महंगी अनुभव एकत्र करने की आवश्यकता को कम करता है।

MethodMind में खोलेंजल्द हीवीडियोजल्द हीस्लाइड डाउनलोड करें

पूरी विधि पढ़ें

केवल सदस्यों के लिए

यह खंड पढ़ने के लिए निःशुल्क खाते से साइन इन करें।

साइन इन करें

पद्धति मानचित्र

सम्बन्धित पद्धतियों का परिवेश — अन्वेषण हेतु किसी नोड का चयन करें।

डोमेन-अनुकूलनीय सुदृढीकरण अधिगम

डीप रीइन्फोर्समेंट लर्नि…ट्रांसफर लर्निंग अर्ध-पर्यवेक्षित सुदृढीक…प्रबलन शिक्षण के साथ स्थ…

स्रोत

Kim, K., Kim, H., Lim, H., & Choi, J. (2020). Domain Adaptive Reinforcement Learning with Model-Based Approach. arXiv preprint arXiv:2102.03170. link ↗
Domain adaptation. Wikipedia. link ↗

इस पृष्ठ का उद्धरण कैसे दें

ScholarGate. (2026, June 3). Domain-Adaptive Reinforcement Learning. ScholarGate. https://scholargate.app/hi/deep-learning/domain-adaptive-reinforcement-learning

कौन-सी पद्धति?

इस पद्धति को उसकी निकटतम सजातीय पद्धतियों के साथ रखकर उन्हें साथ-साथ पढ़ें — पुस्तकालय पुस्तकें मेज़ पर रख देता है; चुनाव आपका है।

डीप रीइन्फोर्समेंट लर्निंगगहन अधिगम↔ तुलना करें
ट्रांसफर लर्निंगमशीन अधिगम↔ तुलना करें

साथ-साथ तुलना करें →

इनमें संदर्भित

अर्ध-पर्यवेक्षित सुदृढीकरण अधिगम (Semi-supervised Reinforcement Learning)प्रबलन शिक्षण के साथ स्थानांतरण शिक्षण

इस पृष्ठ पर कोई त्रुटि दिखी? सूचित करें या सुधार सुझाएँ →