Machine learningDeep learning / NLP / CV

Jifunze kwa Kuimarisha (Reinforcement Learning)

Jifunze kwa Kuimarisha (RL) ni mfumo ambapo ajenti hujifunza kufanya maamuzi mfululizo kwa kuingiliana na mazingira, kupokea mawimbi ya tuzo ya scalar, na kusasisha sera ili kuongeza tuzo ya baadaye kwa jumla. Tofauti na kujifunza kwa usimamizi, hakuna mifano yenye lebo inayotolewa; ajenti hugundua tabia bora kupitia uzoefu na maoni yaliyocheleweshwa.

Fungua katika MethodMindHivi karibuniVideoHivi karibuniDownload slides

Soma mbinu kamili

Kwa wanachama pekee

Ingia kwa akaunti ya bure ili kusoma sehemu hii.

Ingia

Method map

The neighbourhood of related methods — select a node to explore.

Jifunze kwa Kuimarisha (Reinforcement Learning)

Mbinu za Kielelezo cha S…Mtandao wa Nyuro Unaojir…Uratibu wa Kieletroniki…Uprogramu Amilifu wa Kib…Explainable Reinforcemen…Ujifunzaji wa Kuimarisha…Jifunze za Lugha Nyingi Ujifunzaji Tumizi wa Nji…Ujifunzaji wa Uimarishaj…Msisimko wa usaidizi wa…

+2 more

Vyanzo

Sutton, R. S. & Barto, A. G. (2018). Reinforcement Learning: An Introduction (2nd ed.). MIT Press. ISBN: 978-0-262-03924-6
Mnih, V., Kavukcuoglu, K., Silver, D., et al. (2015). Human-level control through deep reinforcement learning. Nature, 518, 529–533. DOI: 10.1038/nature14236 ↗

Jinsi ya kunukuu ukurasa huu

ScholarGate. (2026, June 3). Reinforcement Learning (Agent-Environment Reward Optimization). ScholarGate. https://scholargate.app/sw/deep-learning/reinforcement-learning

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Mbinu za Kielelezo cha SeraUjifunzaji wa Mashine↔ compare
Mtandao wa Nyuro UnaojirudiaUjifunzaji wa Kina↔ compare

Compare side by side →

Imerejelewa na

Uratibu wa Kieletroniki wa Mawakala Uprogramu Amilifu wa Kibayesi Explainable Reinforcement Learning Ujifunzaji wa Kuimarisha Uliosafishwa (Fine-Tuned Reinforcement Learning)Jifunze za Lugha Nyingi Ujifunzaji Tumizi wa Njia Nyingi (Multimodal Reinforcement Learning)Ujifunzaji wa Uimarishaji Unaojisimamia Kwenyewe Msisimko wa usaidizi wa kujifunza (Semi-supervised Reinforcement Learning)Kujifunza kwa Kuhamisha kwa Kutumia Kujifunza kwa Uimarishaji Jifunze la Uimarishaji la Usimamizi dhaifu

Umeona tatizo kwenye ukurasa huu? Ripoti au pendekeza marekebisho →