Machine learningDeep learning / NLP / CV

बहुविध सुदृढीकरण अधिगम

बहुविध सुदृढीकरण अधिगम (Multimodal Reinforcement Learning) ऐसे अभिकर्ताओं को प्रशिक्षित करता है जो अनुक्रमिक निर्णय लेने के लिए एक साथ कई इनपुट विधाओं - जैसे कि कच्चे पिक्सेल, भाषा निर्देश, ऑडियो और प्रोप्रियोसेप्टिव सेंसर - को समझते और एकीकृत करते हैं। एकल डेटा स्ट्रीम पर कार्य करने के बजाय, अभिकर्ता विषम संकेतों को एक एकीकृत स्थिति प्रतिनिधित्व में मिलाता है और पर्यावरणीय पुरस्कार प्रतिक्रिया के माध्यम से एक नीति सीखता है।

MethodMind में खोलेंजल्द हीवीडियोजल्द हीDownload slides

पूरी विधि पढ़ें

केवल सदस्यों के लिए

यह खंड पढ़ने के लिए निःशुल्क खाते से साइन इन करें।

साइन इन करें

Method map

The neighbourhood of related methods — select a node to explore.

स्रोत

  1. Reed, S., Zolna, K., Parisotto, E., Colmenarejo, S. G., Novikov, A., Barth-Maron, G., ... & de Freitas, N. (2022). A Generalist Agent. Transactions on Machine Learning Research. link
  2. Multimodal learning. Wikipedia. link

इस पृष्ठ का उद्धरण कैसे दें

ScholarGate. (2026, June 3). Multimodal Reinforcement Learning (Multi-Sensory RL Agent Learning). ScholarGate. https://scholargate.app/hi/deep-learning/multimodal-reinforcement-learning

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side
ScholarGateMultimodal Reinforcement Learning (Multimodal Reinforcement Learning (Multi-Sensory RL Agent Learning)). 2026-06-15 को यहाँ से प्राप्त https://scholargate.app/hi/deep-learning/multimodal-reinforcement-learning · डेटासेट: https://doi.org/10.5281/zenodo.20539026