Attention Mechanism (Bahdanau / Luong Attention)
Ein einfacher Encoder-Decoder presst eine ganze Eingabesequenz in einen einzigen festen Kontextvektor, der bei langen Sequenzen zu einem Engpass wird. Attention beseitigt diesen Engpass: Bei jedem Ausgabeschritt blickt der Decoder über alle Encoder-Zustände zurück und berechnet eine gewichtete Mischung, die sich stark auf die wenigen Positionen stützt, die für das Wort, das er gerade produzieren will, wichtig sind. Es ist, als ob ein Übersetzer auf die relevantesten Quellwörter zurückblickt, anstatt zu versuchen, den gesamten Satz auf einmal zu erinnern.
Die vollständige Methode lesen
Melden Sie sich mit einem kostenlosen Konto an, um diesen Abschnitt zu lesen.
Method map
The neighbourhood of related methods — select a node to explore.
+3 more
Quellen
- Bahdanau, D., Cho, K. & Bengio, Y. (2015). Neural Machine Translation by Jointly Learning to Align and Translate. ICLR. link ↗
- Luong, M.T., Pham, H. & Manning, C.D. (2015). Effective Approaches to Attention-based Neural Machine Translation. EMNLP, 1412–1421. DOI: 10.18653/v1/D15-1166 ↗
So zitieren Sie diese Seite
ScholarGate. (2026, June 1). Attention Mechanism (Bahdanau / Luong Attention). ScholarGate. https://scholargate.app/de/deep-learning/attention-mechanism
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- BERT-FeinabstimmungDeep Learning↔ compare
- GPT-FeinabstimmungDeep Learning↔ compare
- Random ForestMaschinelles Lernen↔ compare
- Multi-Head Self-AttentionDeep Learning↔ compare
- XGBoostMaschinelles Lernen↔ compare
Referenziert von
Einen Fehler auf dieser Seite entdeckt? Melden oder Korrektur vorschlagen →