Machine learning
Multi-Head Self-Attention
Multi-head self-attentionは、2017年にVaswaniらによって導入されたメカニズムであり、シーケンス内の各位置が他のすべての位置との関係を並列に計算することを可能にします。これはTransformerアーキテクチャの中核であり、BERT、GPT、T5の基盤となっています。
手法の全文を読む
会員限定
ログイン無料アカウントでログインすると、このセクションを読めます。
Method map
The neighbourhood of related methods — select a node to explore.
出典
このページの引用方法
ScholarGate. (2026, June 1). Multi-Head Self-Attention (Transformer Core). ScholarGate. https://scholargate.app/ja/deep-learning/self-attention-transformer
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- BERTファインチューニング深層学習↔ compare
- GPTファインチューニング深層学習↔ compare
- LoRAとPEFT深層学習↔ compare
- ランダムフォレスト機械学習↔ compare
- XGBoost機械学習↔ compare