Machine learning
ความสนใจหลายหัวของตนเอง (Multi-Head Self-Attention)
Multi-head self-attention ซึ่ง Vaswani และคณะได้นำเสนอในปี 2017 เป็นกลไกที่ช่วยให้แต่ละตำแหน่งในลำดับสามารถคำนวณความสัมพันธ์กับตำแหน่งอื่น ๆ ทั้งหมดได้พร้อมกัน กลไกนี้เป็นหัวใจของสถาปัตยกรรม Transformer และเป็นรากฐานของ BERT, GPT และ T5
อ่านวิธีฉบับเต็ม
สำหรับสมาชิกเท่านั้น
เข้าสู่ระบบเข้าสู่ระบบด้วยบัญชีฟรีเพื่ออ่านส่วนนี้
Method map
The neighbourhood of related methods — select a node to explore.
แหล่งอ้างอิง
วิธีอ้างอิงหน้านี้
ScholarGate. (2026, June 1). Multi-Head Self-Attention (Transformer Core). ScholarGate. https://scholargate.app/th/deep-learning/self-attention-transformer
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- การปรับจูน BERTการเรียนรู้เชิงลึก↔ compare
- การปรับละเอียด GPT (GPT Fine-Tuning)การเรียนรู้เชิงลึก↔ compare
- LoRA และ PEFTการเรียนรู้เชิงลึก↔ compare
- Random Forestการเรียนรู้ของเครื่อง↔ compare
- XGBoostการเรียนรู้ของเครื่อง↔ compare