Selgitatav tugevdamisõpe
Selgitatav tugevdamisõpe (XRL) täiendab tavalisi tugevdamisõppe agente meetoditega, mis muudavad nende poliitikad, otsused ja õpitud käitumised inimestele arusaadavaks. Selle asemel, et käsitleda poliitikat musta kastina, loob XRL post-hoc selgitusi või ehitab sisemiselt läbipaistvaid poliitikaid, võimaldades usaldusväärsuse kontrollimist, silumist ja vastutust kõrge panusega automatiseeritud otsuste tegemisel.
Loe meetodi täielikku kirjeldust
Selle osa lugemiseks logi sisse tasuta kontoga.
Method map
The neighbourhood of related methods — select a node to explore.
Allikad
- Puiutta, E., & Veith, E. M. S. P. (2020). Explainable Reinforcement Learning: A Survey. In Machine Learning and Knowledge Extraction (CD-MAKE 2020), Lecture Notes in Computer Science, vol. 12279, pp. 77–95. Springer. DOI: 10.1007/978-3-030-57321-8_5 ↗
- Explainable artificial intelligence. Wikipedia. link ↗
Kuidas sellele lehele viidata
ScholarGate. (2026, June 3). Explainable Reinforcement Learning (XRL). ScholarGate. https://scholargate.app/et/deep-learning/explainable-reinforcement-learning
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Tähelepanu mehhanismSüvaõpe↔ compare
- Seletatav BERT-põhine klassifitseerimineSüvaõpe↔ compare
- TugevdamisõpeSüvaõpe↔ compare
Märkasid sellel lehel viga? Teata sellest või paku parandust →