Machine learning

Atenție Multi-Capete (Multi-Head Self-Attention)

Atenția multi-capete, introdusă de Vaswani și colegii în 2017, este mecanismul care permite fiecărei poziții dintr-o secvență să-și calculeze relația cu toate celelalte poziții în paralel. Este nucleul arhitecturii Transformer și fundamentul pe care se bazează BERT, GPT și T5.

Deschide în MethodMindÎn curândVideoÎn curândDescarcă prezentarea

Citește metoda completă

Doar pentru membri

Autentifică-te cu un cont gratuit pentru a citi această secțiune.

Autentificare

Harta metodelor

Vecinătatea metodelor înrudite — selectați un nod pentru a explora.

Atenție Multi-Capete (Multi-Head Self-Attention)

Reglajul fin BERT Ajustarea fină a modelel…LoRA și PEFT Pădurea Aleatoare (Rando…XGBoost Mecanismul de atenție RNN bidirecțional Generare Augmentată prin…Model Secvență-la-Secven…

Surse

Vaswani, A. et al. (2017). Attention Is All You Need. NeurIPS. link ↗
Devlin, J. et al. (2019). BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. NAACL. link ↗

Cum se citează această pagină

ScholarGate. (2026, June 1). Multi-Head Self-Attention (Transformer Core). ScholarGate. https://scholargate.app/ro/deep-learning/self-attention-transformer

Ce metodă?

Așezați această metodă lângă cele mai apropiate rude și citiți-le alăturat — biblioteca pune cărțile pe masă; alegerea vă aparține.

Reglajul fin BERTÎnvățare profundă↔ compară
Ajustarea fină a modelelor GPTÎnvățare profundă↔ compară
LoRA și PEFTÎnvățare profundă↔ compară
Pădurea Aleatoare (Random Forest)Învățare automată↔ compară
XGBoostÎnvățare automată↔ compară

Compară alăturat →

Citat de

Mecanismul de atenție RNN bidirecțional Generare Augmentată prin Regăsire (RAG)Model Secvență-la-Secvență

Ai observat o problemă pe această pagină? Raportează sau sugerează o corectură →

Citește metoda completă

Harta metodelor

Surse

Cum se citează această pagină

Metode înrudite

Ce metodă?

Citat de