Ενισχυτική Μάθηση Ασθενώς Επιβλεπόμενη
Η Ενισχυτική Μάθηση Ασθενώς Επιβλεπόμενη (WSRL) εκπαιδεύει πράκτορες σε περιβάλλοντα όπου το σήμα ανταμοιβής είναι ατελές, αραιό, καθυστερημένο ή μόνο μερικώς πληροφοριακό — σε αντίθεση με την πυκνή πλήρως επιβλεπόμενη RL. Ο πράκτορας πρέπει να μάθει αποτελεσματικές πολιτικές παρά την ελλιπή ανατροφοδότηση, χρησιμοποιώντας βοηθητικά σήματα, μοντελοποίηση ανταμοιβής ή μάθηση προτιμήσεων για να αντισταθμίσει την ασθενή επίβλεψη.
Διαβάστε ολόκληρη τη μέθοδο
Συνδεθείτε με δωρεάν λογαριασμό για να διαβάσετε αυτή την ενότητα.
Method map
The neighbourhood of related methods — select a node to explore.
Πηγές
- Sutton, R. S. & Barto, A. G. (2018). Reinforcement Learning: An Introduction (2nd ed.). MIT Press. ISBN: 978-0-262-03924-6
- Christiano, P., Leike, J., Brown, T. B., Martic, M., Legg, S. & Amodei, D. (2017). Deep reinforcement learning from human preferences. Advances in Neural Information Processing Systems (NeurIPS), 30. link ↗
Πώς να παραπέμψετε σε αυτή τη σελίδα
ScholarGate. (2026, June 3). Weakly Supervised Reinforcement Learning. ScholarGate. https://scholargate.app/el/deep-learning/weakly-supervised-reinforcement-learning
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Ενισχυτική ΜάθησηΒαθιά Μάθηση↔ compare
- Ενισχυτική Μάθηση με Αυτο-εποπτείαΒαθιά Μάθηση↔ compare
- Ημι-επιβλεπόμενη Ενισχυτική ΜάθησηΒαθιά Μάθηση↔ compare
Αναφέρεται από
Εντοπίσατε πρόβλημα σε αυτή τη σελίδα; Αναφέρετέ το ή προτείνετε διόρθωση →