Ενισχυτική Μάθηση
Η Ενισχυτική Μάθηση (Reinforcement Learning - RL) είναι ένα πλαίσιο στο οποίο ένας πράκτορας μαθαίνει να λαμβάνει διαδοχικές αποφάσεις αλληλεπιδρώντας με ένα περιβάλλον, λαμβάνοντας βαθμωτά σήματα ανταμοιβής και ενημερώνοντας μια πολιτική για μεγιστοποίηση της σωρευτικής μελλοντικής ανταμοιβής. Σε αντίθεση με την επιβλεπόμενη μάθηση, δεν παρέχονται επισημασμένα παραδείγματα· ο πράκτορας ανακαλύπτει τη βέλτιστη συμπεριφορά αποκλειστικά μέσω εμπειρίας και καθυστερημένης ανάδρασης.
Διαβάστε ολόκληρη τη μέθοδο
Συνδεθείτε με δωρεάν λογαριασμό για να διαβάσετε αυτή την ενότητα.
Method map
The neighbourhood of related methods — select a node to explore.
+2 more
Πηγές
- Sutton, R. S. & Barto, A. G. (2018). Reinforcement Learning: An Introduction (2nd ed.). MIT Press. ISBN: 978-0-262-03924-6
- Mnih, V., Kavukcuoglu, K., Silver, D., et al. (2015). Human-level control through deep reinforcement learning. Nature, 518, 529–533. DOI: 10.1038/nature14236 ↗
Πώς να παραπέμψετε σε αυτή τη σελίδα
ScholarGate. (2026, June 3). Reinforcement Learning (Agent-Environment Reward Optimization). ScholarGate. https://scholargate.app/el/deep-learning/reinforcement-learning
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Μέθοδοι Κλίσης ΠολιτικήςΜηχανική Μάθηση↔ compare
- Αναδρομικό Νευρωνικό ΔίκτυοΒαθιά Μάθηση↔ compare
Αναφέρεται από
Εντοπίσατε πρόβλημα σε αυτή τη σελίδα; Αναφέρετέ το ή προτείνετε διόρθωση →