Multi-Head Self-Attention
Mechanizm wielogłowicowej samoatencji (Multi-Head Self-Attention), wprowadzony przez Vaswani i współpracowników w 2017 roku, pozwala każdej pozycji w sekwencji na równoległe obliczanie jej relacji ze wszystkimi innymi pozycjami. Jest to rdzeń architektury Transformer i podstawa modeli BERT, GPT i T5.
Przeczytaj pełny opis metody
Zaloguj się na bezpłatne konto, aby przeczytać tę sekcję.
Method map
The neighbourhood of related methods — select a node to explore.
Źródła
Jak cytować tę stronę
ScholarGate. (2026, June 1). Multi-Head Self-Attention (Transformer Core). ScholarGate. https://scholargate.app/pl/deep-learning/self-attention-transformer
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Dostrajanie BERTUczenie głębokie↔ compare
- Dostrajanie GPTUczenie głębokie↔ compare
- LoRA i PEFTUczenie głębokie↔ compare
- Random ForestUczenie maszynowe↔ compare
- XGBoostUczenie maszynowe↔ compare
Cytowana przez
Widzisz błąd na tej stronie? Zgłoś go lub zaproponuj poprawkę →