Machine learningDeep learning / NLP / CV

Học tăng cường

Học tăng cường (RL) là một khuôn khổ trong đó một tác nhân học cách đưa ra các quyết định tuần tự bằng cách tương tác với môi trường, nhận tín hiệu phần thưởng vô hướng và cập nhật một chính sách để tối đa hóa phần thưởng tích lũy trong tương lai. Khác với học có giám sát, không có ví dụ được gán nhãn nào được cung cấp; tác nhân khám phá hành vi tối ưu hoàn toàn thông qua kinh nghiệm và phản hồi trễ.

Mở trong MethodMindSắp ra mắtVideoSắp ra mắtDownload slides

Đọc toàn bộ phương pháp

Chỉ dành cho thành viên

Đăng nhập bằng tài khoản miễn phí để đọc phần này.

Đăng nhập

Method map

The neighbourhood of related methods — select a node to explore.

Học tăng cường

Phương pháp độ dốc chính…Mạng nơ-ron hồi quy Lập trình động dựa trên…Quy hoạch động Bayes Học tăng cường có thể gi…Học tăng cường tinh chỉn…Học tăng cường đa ngôn n…Học tăng cường đa phương…Học tăng cường tự giám s…Học tăng cường bán giám…

+2 more

Nguồn tài liệu

Sutton, R. S. & Barto, A. G. (2018). Reinforcement Learning: An Introduction (2nd ed.). MIT Press. ISBN: 978-0-262-03924-6
Mnih, V., Kavukcuoglu, K., Silver, D., et al. (2015). Human-level control through deep reinforcement learning. Nature, 518, 529–533. DOI: 10.1038/nature14236 ↗

Cách trích dẫn trang này

ScholarGate. (2026, June 3). Reinforcement Learning (Agent-Environment Reward Optimization). ScholarGate. https://scholargate.app/vi/deep-learning/reinforcement-learning

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Phương pháp độ dốc chính sáchHọc máy↔ compare
Mạng nơ-ron hồi quyHọc sâu↔ compare

Compare side by side →

Được tham chiếu bởi

Lập trình động dựa trên tác nhân Quy hoạch động Bayes Học tăng cường có thể giải thích được Học tăng cường tinh chỉnh (Fine-Tuned Reinforcement Learning)Học tăng cường đa ngôn ngữ Học tăng cường đa phương thức Học tăng cường tự giám sát Học tăng cường bán giám sát Học chuyển giao với Học tăng cường Học tăng cường giám sát yếu

Phát hiện lỗi trên trang này? Báo cáo hoặc đề xuất chỉnh sửa →