Ημι-επιβλεπόμενη Ενισχυτική Μάθηση
Η ημι-επιβλεπόμενη ενισχυτική μάθηση (SSRL) συνδυάζει την τυπική ενισχυτική μάθηση — όπου ένας παράγοντας μαθαίνει από αραιά σήματα ανταμοιβής — με ημι-επιβλεπόμενες τεχνικές που εξάγουν δομή από μη επισημασμένες αλληλεπιδράσεις περιβάλλοντος. Στόχος είναι η βελτίωση της αποδοτικότητας δειγματοληψίας και της γενίκευσης όταν η ανατροφοδότηση ανταμοιβής είναι δαπανηρή, καθυστερημένη ή διαθέσιμη μόνο για ένα κλάσμα της εμπειρίας του παράγοντα.
Διαβάστε ολόκληρη τη μέθοδο
Συνδεθείτε με δωρεάν λογαριασμό για να διαβάσετε αυτή την ενότητα.
Method map
The neighbourhood of related methods — select a node to explore.
Πηγές
- Zhan, X., Zhu, X., & Shi, H. (2022). Deepthermal: Combustion optimization for thermal power generating units using offline reinforcement learning. Proceedings of the AAAI Conference on Artificial Intelligence, 36(4), 4680–4688. link ↗
- Laskin, M., Srinivas, A., & Abbeel, P. (2020). CURL: Contrastive Unsupervised Representations for Reinforcement Learning. Proceedings of the 37th International Conference on Machine Learning (ICML), PMLR 119, 5639–5650. link ↗
Πώς να παραπέμψετε σε αυτή τη σελίδα
ScholarGate. (2026, June 3). Semi-supervised Reinforcement Learning (SSRL). ScholarGate. https://scholargate.app/el/deep-learning/semi-supervised-reinforcement-learning
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Ενισχυτική Μάθηση Προσαρμοσμένη στον ΤομέαΒαθιά Μάθηση↔ compare
- Ενισχυτική ΜάθησηΒαθιά Μάθηση↔ compare
- Ενισχυτική Μάθηση με Αυτο-εποπτείαΒαθιά Μάθηση↔ compare
- Ημι-επιβλεπόμενος ΜετασχηματιστήςΒαθιά Μάθηση↔ compare
- Εκμάθηση Μεταφοράς με Ενισχυτική ΜάθησηΒαθιά Μάθηση↔ compare
- Ενισχυτική Μάθηση Ασθενώς ΕπιβλεπόμενηΒαθιά Μάθηση↔ compare
Αναφέρεται από
Εντοπίσατε πρόβλημα σε αυτή τη σελίδα; Αναφέρετέ το ή προτείνετε διόρθωση →