Machine learningDeep learning / NLP / CV

การเรียนรู้แบบเสริมกำลังที่ปรับตามโดเมน

การเรียนรู้แบบเสริมกำลังที่ปรับตามโดเมน (Domain-Adaptive Reinforcement Learning - DARL) เป็นการขยายขอบเขตของการเรียนรู้แบบเสริมกำลังมาตรฐาน (standard RL) โดยช่วยให้นโยบาย (policy) ที่ได้รับการฝึกฝนในสภาพแวดล้อมหรือโดเมนหนึ่ง สามารถถ่ายทอดและปรับใช้กับโดเมนเป้าหมายที่แตกต่างแต่เกี่ยวข้องกันได้อย่างมีประสิทธิภาพ DARL แก้ปัญหาการเปลี่ยนแปลงโดเมน (domain-shift) ซึ่งพลวัต (dynamics) การสังเกต (observations) หรือโครงสร้างรางวัล (reward structures) แตกต่างกันระหว่างการฝึกฝนและการนำไปใช้งานจริง โดยใช้เทคนิคการปรับแนว (alignment) การปรับตัว (adaptation) หรือการสุ่มโดเมน (domain-randomisation) ซึ่งช่วยลดความจำเป็นในการเก็บรวบรวมประสบการณ์ที่มีค่าใช้จ่ายสูงในโดเมนเป้าหมาย

เปิดใน MethodMindเร็ว ๆ นี้วิดีโอเร็ว ๆ นี้Download slides

อ่านวิธีฉบับเต็ม

สำหรับสมาชิกเท่านั้น

เข้าสู่ระบบด้วยบัญชีฟรีเพื่ออ่านส่วนนี้

เข้าสู่ระบบ

Method map

The neighbourhood of related methods — select a node to explore.

การเรียนรู้แบบเสริมกำลังที่ปรับตามโดเมน

การเรียนรู้แบบเสริมกำลัง…การเรียนรู้แบบถ่ายโอน การเรียนรู้แบบเสริมกำลัง…Transfer Learning with R…

แหล่งอ้างอิง

Kim, K., Kim, H., Lim, H., & Choi, J. (2020). Domain Adaptive Reinforcement Learning with Model-Based Approach. arXiv preprint arXiv:2102.03170. link ↗
Domain adaptation. Wikipedia. link ↗

วิธีอ้างอิงหน้านี้

ScholarGate. (2026, June 3). Domain-Adaptive Reinforcement Learning. ScholarGate. https://scholargate.app/th/deep-learning/domain-adaptive-reinforcement-learning

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

การเรียนรู้แบบเสริมกำลังเชิงลึกการเรียนรู้เชิงลึก↔ compare
การเรียนรู้แบบถ่ายโอนการเรียนรู้ของเครื่อง↔ compare

Compare side by side →

ถูกอ้างอิงโดย

การเรียนรู้แบบเสริมกำลังกึ่งมีผู้สอน Transfer Learning with Reinforcement Learning

พบปัญหาในหน้านี้หรือไม่ แจ้งหรือเสนอการแก้ไข →