Autoatenção Multi-Cabeça
A autoatenção multi-cabeça (multi-head self-attention), introduzida por Vaswani e colegas em 2017, é o mecanismo que permite que cada posição em uma sequência calcule sua relação com todas as outras posições em paralelo. É o cerne da arquitetura Transformer e a base subjacente a BERT, GPT e T5.
Leia o método completo
Entre com uma conta gratuita para ler esta seção.
Mapa de métodos
A vizinhança de métodos relacionados — selecione um nó para explorar.
Fontes
Como citar esta página
ScholarGate. (2026, June 1). Multi-Head Self-Attention (Transformer Core). ScholarGate. https://scholargate.app/pt/deep-learning/self-attention-transformer
Qual método?
Coloque este método ao lado dos seus pares mais próximos e leia-os lado a lado — a biblioteca dispõe os livros sobre a mesa; a escolha é sua.
- Ajuste Fino de BERTAprendizado profundo↔ comparar
- GPT Fine-TuningAprendizado profundo↔ comparar
- LoRA e PEFTAprendizado profundo↔ comparar
- Random ForestAprendizado de máquina↔ comparar
- XGBoostAprendizado de máquina↔ comparar
Referenciado por
Encontrou um problema nesta página? Relate ou sugira uma correção →