การเรียนรู้แบบเสริมกำลังที่ปรับตามโดเมน
การเรียนรู้แบบเสริมกำลังที่ปรับตามโดเมน (Domain-Adaptive Reinforcement Learning - DARL) เป็นการขยายขอบเขตของการเรียนรู้แบบเสริมกำลังมาตรฐาน (standard RL) โดยช่วยให้นโยบาย (policy) ที่ได้รับการฝึกฝนในสภาพแวดล้อมหรือโดเมนหนึ่ง สามารถถ่ายทอดและปรับใช้กับโดเมนเป้าหมายที่แตกต่างแต่เกี่ยวข้องกันได้อย่างมีประสิทธิภาพ DARL แก้ปัญหาการเปลี่ยนแปลงโดเมน (domain-shift) ซึ่งพลวัต (dynamics) การสังเกต (observations) หรือโครงสร้างรางวัล (reward structures) แตกต่างกันระหว่างการฝึกฝนและการนำไปใช้งานจริง โดยใช้เทคนิคการปรับแนว (alignment) การปรับตัว (adaptation) หรือการสุ่มโดเมน (domain-randomisation) ซึ่งช่วยลดความจำเป็นในการเก็บรวบรวมประสบการณ์ที่มีค่าใช้จ่ายสูงในโดเมนเป้าหมาย
อ่านวิธีฉบับเต็ม
เข้าสู่ระบบด้วยบัญชีฟรีเพื่ออ่านส่วนนี้
Method map
The neighbourhood of related methods — select a node to explore.
แหล่งอ้างอิง
วิธีอ้างอิงหน้านี้
ScholarGate. (2026, June 3). Domain-Adaptive Reinforcement Learning. ScholarGate. https://scholargate.app/th/deep-learning/domain-adaptive-reinforcement-learning
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- การเรียนรู้แบบเสริมกำลังเชิงลึกการเรียนรู้เชิงลึก↔ compare
- การเรียนรู้แบบถ่ายโอนการเรียนรู้ของเครื่อง↔ compare