Machine learningDeep learning / NLP / CV

การเรียนรู้แบบเสริมกำลังที่ปรับตามโดเมน

การเรียนรู้แบบเสริมกำลังที่ปรับตามโดเมน (Domain-Adaptive Reinforcement Learning - DARL) เป็นการขยายขอบเขตของการเรียนรู้แบบเสริมกำลังมาตรฐาน (standard RL) โดยช่วยให้นโยบาย (policy) ที่ได้รับการฝึกฝนในสภาพแวดล้อมหรือโดเมนหนึ่ง สามารถถ่ายทอดและปรับใช้กับโดเมนเป้าหมายที่แตกต่างแต่เกี่ยวข้องกันได้อย่างมีประสิทธิภาพ DARL แก้ปัญหาการเปลี่ยนแปลงโดเมน (domain-shift) ซึ่งพลวัต (dynamics) การสังเกต (observations) หรือโครงสร้างรางวัล (reward structures) แตกต่างกันระหว่างการฝึกฝนและการนำไปใช้งานจริง โดยใช้เทคนิคการปรับแนว (alignment) การปรับตัว (adaptation) หรือการสุ่มโดเมน (domain-randomisation) ซึ่งช่วยลดความจำเป็นในการเก็บรวบรวมประสบการณ์ที่มีค่าใช้จ่ายสูงในโดเมนเป้าหมาย

เปิดใน MethodMindเร็ว ๆ นี้วิดีโอเร็ว ๆ นี้Download slides

อ่านวิธีฉบับเต็ม

สำหรับสมาชิกเท่านั้น

เข้าสู่ระบบด้วยบัญชีฟรีเพื่ออ่านส่วนนี้

เข้าสู่ระบบ

Method map

The neighbourhood of related methods — select a node to explore.

แหล่งอ้างอิง

  1. Kim, K., Kim, H., Lim, H., & Choi, J. (2020). Domain Adaptive Reinforcement Learning with Model-Based Approach. arXiv preprint arXiv:2102.03170. link
  2. Domain adaptation. Wikipedia. link

วิธีอ้างอิงหน้านี้

ScholarGate. (2026, June 3). Domain-Adaptive Reinforcement Learning. ScholarGate. https://scholargate.app/th/deep-learning/domain-adaptive-reinforcement-learning

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

ถูกอ้างอิงโดย

ScholarGateDomain-adaptive reinforcement learning (Domain-Adaptive Reinforcement Learning). สืบค้นเมื่อ 2026-06-15 จาก https://scholargate.app/th/deep-learning/domain-adaptive-reinforcement-learning · ชุดข้อมูล: https://doi.org/10.5281/zenodo.20539026