ScholarGate
सहायक
Machine learningDeep learning / NLP / CV

डोमेन-अनुकूलनीय सुदृढीकरण अधिगम

डोमेन-अनुकूलनीय सुदृढीकरण अधिगम (DARL) मानक RL का विस्तार करता है, जिससे एक वातावरण या डोमेन में प्रशिक्षित नीति को एक भिन्न लेकिन संबंधित लक्ष्य डोमेन में प्रभावी ढंग से स्थानांतरित और सामान्यीकृत किया जा सकता है। यह डोमेन-शिफ्ट समस्या का समाधान करता है — जहाँ प्रशिक्षण और परिनियोजन के बीच गतिकी, अवलोकन या पुरस्कार संरचनाएँ भिन्न होती हैं — संरेखण, अनुकूलन, या डोमेन-यादृच्छिकीकरण तकनीकों के माध्यम से, लक्ष्य डोमेन में महंगी अनुभव एकत्र करने की आवश्यकता को कम करता है।

MethodMind में खोलेंजल्द हीवीडियोजल्द हीस्लाइड डाउनलोड करें

पूरी विधि पढ़ें

केवल सदस्यों के लिए

यह खंड पढ़ने के लिए निःशुल्क खाते से साइन इन करें।

साइन इन करें

पद्धति मानचित्र

सम्बन्धित पद्धतियों का परिवेश — अन्वेषण हेतु किसी नोड का चयन करें।

स्रोत

  1. Kim, K., Kim, H., Lim, H., & Choi, J. (2020). Domain Adaptive Reinforcement Learning with Model-Based Approach. arXiv preprint arXiv:2102.03170. link
  2. Domain adaptation. Wikipedia. link

इस पृष्ठ का उद्धरण कैसे दें

ScholarGate. (2026, June 3). Domain-Adaptive Reinforcement Learning. ScholarGate. https://scholargate.app/hi/deep-learning/domain-adaptive-reinforcement-learning

कौन-सी पद्धति?

इस पद्धति को उसकी निकटतम सजातीय पद्धतियों के साथ रखकर उन्हें साथ-साथ पढ़ें — पुस्तकालय पुस्तकें मेज़ पर रख देता है; चुनाव आपका है।

साथ-साथ तुलना करें

इनमें संदर्भित

ScholarGateDomain-adaptive reinforcement learning (Domain-Adaptive Reinforcement Learning). 2026-06-15 को यहाँ से प्राप्त https://scholargate.app/hi/deep-learning/domain-adaptive-reinforcement-learning · डेटासेट: https://doi.org/10.5281/zenodo.20539026