Atenție Multi-Capete (Multi-Head Self-Attention)
Atenția multi-capete, introdusă de Vaswani și colegii în 2017, este mecanismul care permite fiecărei poziții dintr-o secvență să-și calculeze relația cu toate celelalte poziții în paralel. Este nucleul arhitecturii Transformer și fundamentul pe care se bazează BERT, GPT și T5.
Citește metoda completă
Autentifică-te cu un cont gratuit pentru a citi această secțiune.
Harta metodelor
Vecinătatea metodelor înrudite — selectați un nod pentru a explora.
Surse
Cum se citează această pagină
ScholarGate. (2026, June 1). Multi-Head Self-Attention (Transformer Core). ScholarGate. https://scholargate.app/ro/deep-learning/self-attention-transformer
Ce metodă?
Așezați această metodă lângă cele mai apropiate rude și citiți-le alăturat — biblioteca pune cărțile pe masă; alegerea vă aparține.
- Reglajul fin BERTÎnvățare profundă↔ compară
- Ajustarea fină a modelelor GPTÎnvățare profundă↔ compară
- LoRA și PEFTÎnvățare profundă↔ compară
- Pădurea Aleatoare (Random Forest)Învățare automată↔ compară
- XGBoostÎnvățare automată↔ compară
Citat de
Ai observat o problemă pe această pagină? Raportează sau sugerează o corectură →