Machine learningDeep learning / NLP / CV

बहुविध सुदृढीकरण अधिगम

बहुविध सुदृढीकरण अधिगम (Multimodal Reinforcement Learning) ऐसे अभिकर्ताओं को प्रशिक्षित करता है जो अनुक्रमिक निर्णय लेने के लिए एक साथ कई इनपुट विधाओं - जैसे कि कच्चे पिक्सेल, भाषा निर्देश, ऑडियो और प्रोप्रियोसेप्टिव सेंसर - को समझते और एकीकृत करते हैं। एकल डेटा स्ट्रीम पर कार्य करने के बजाय, अभिकर्ता विषम संकेतों को एक एकीकृत स्थिति प्रतिनिधित्व में मिलाता है और पर्यावरणीय पुरस्कार प्रतिक्रिया के माध्यम से एक नीति सीखता है।

MethodMind में खोलेंजल्द हीवीडियोजल्द हीDownload slides

पूरी विधि पढ़ें

केवल सदस्यों के लिए

यह खंड पढ़ने के लिए निःशुल्क खाते से साइन इन करें।

साइन इन करें

Method map

The neighbourhood of related methods — select a node to explore.

बहुविध सुदृढीकरण अधिगम

Multimodal Graph Neural…मल्टीमॉडल ट्रांसफार्मर Multimodal Vision Transf…पुनर्बलन अधिगम Self-supervised Reinforc…प्रबलन शिक्षण के साथ स्थ…

स्रोत

Reed, S., Zolna, K., Parisotto, E., Colmenarejo, S. G., Novikov, A., Barth-Maron, G., ... & de Freitas, N. (2022). A Generalist Agent. Transactions on Machine Learning Research. link ↗
Multimodal learning. Wikipedia. link ↗

इस पृष्ठ का उद्धरण कैसे दें

ScholarGate. (2026, June 3). Multimodal Reinforcement Learning (Multi-Sensory RL Agent Learning). ScholarGate. https://scholargate.app/hi/deep-learning/multimodal-reinforcement-learning

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Multimodal Graph Neural Networkगहन अधिगम↔ compare
मल्टीमॉडल ट्रांसफार्मरगहन अधिगम↔ compare
Multimodal Vision Transformerगहन अधिगम↔ compare
पुनर्बलन अधिगमगहन अधिगम↔ compare
Self-supervised Reinforcement Learningगहन अधिगम↔ compare
प्रबलन शिक्षण के साथ स्थानांतरण शिक्षणगहन अधिगम↔ compare

Compare side by side →

इस पृष्ठ पर कोई त्रुटि दिखी? सूचित करें या सुधार सुझाएँ →