Machine learning

Attention Mechanism (Bahdanau / Luong Attention)

Ein einfacher Encoder-Decoder presst eine ganze Eingabesequenz in einen einzigen festen Kontextvektor, der bei langen Sequenzen zu einem Engpass wird. Attention beseitigt diesen Engpass: Bei jedem Ausgabeschritt blickt der Decoder über alle Encoder-Zustände zurück und berechnet eine gewichtete Mischung, die sich stark auf die wenigen Positionen stützt, die für das Wort, das er gerade produzieren will, wichtig sind. Es ist, als ob ein Übersetzer auf die relevantesten Quellwörter zurückblickt, anstatt zu versuchen, den gesamten Satz auf einmal zu erinnern.

In MethodMind öffnenDemnächstVideoDemnächstDownload slides

Die vollständige Methode lesen

Nur für Mitglieder

Melden Sie sich mit einem kostenlosen Konto an, um diesen Abschnitt zu lesen.

Anmelden

Method map

The neighbourhood of related methods — select a node to explore.

Attention Mechanism

BERT-Feinabstimmung GPT-Feinabstimmung Random Forest Multi-Head Self-Attention XGBoost Bidirectional RNN Erklärbares Reinforcemen…Erklärbare Semantische S…Gated Recurrent Unit (GR…Multimodal LSTM

+3 more

Quellen

Bahdanau, D., Cho, K. & Bengio, Y. (2015). Neural Machine Translation by Jointly Learning to Align and Translate. ICLR. link ↗
Luong, M.T., Pham, H. & Manning, C.D. (2015). Effective Approaches to Attention-based Neural Machine Translation. EMNLP, 1412–1421. DOI: 10.18653/v1/D15-1166 ↗

So zitieren Sie diese Seite

ScholarGate. (2026, June 1). Attention Mechanism (Bahdanau / Luong Attention). ScholarGate. https://scholargate.app/de/deep-learning/attention-mechanism

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

BERT-FeinabstimmungDeep Learning↔ compare
GPT-FeinabstimmungDeep Learning↔ compare
Random ForestMaschinelles Lernen↔ compare
Multi-Head Self-AttentionDeep Learning↔ compare
XGBoostMaschinelles Lernen↔ compare

Compare side by side →

Referenziert von

Bidirectional RNN Erklärbares Reinforcement Learning Erklärbare Semantische Segmentierung Gated Recurrent Unit (GRU)Multimodal LSTM Multimodales NLP Sequence-to-Sequence Model T5 (Text-to-Text Transfer Transformer)

Einen Fehler auf dieser Seite entdeckt? Melden oder Korrektur vorschlagen →

Die vollständige Methode lesen

Method map

Quellen

So zitieren Sie diese Seite

Verwandte Methoden

Which method?

Referenziert von