ScholarGate
Assistente
Machine learning

Autoatenção Multi-Cabeça

A autoatenção multi-cabeça (multi-head self-attention), introduzida por Vaswani e colegas em 2017, é o mecanismo que permite que cada posição em uma sequência calcule sua relação com todas as outras posições em paralelo. É o cerne da arquitetura Transformer e a base subjacente a BERT, GPT e T5.

Abrir no MethodMindEm breveVídeoEm breveBaixar slides

Leia o método completo

Exclusivo para membros

Entre com uma conta gratuita para ler esta seção.

Entrar

Mapa de métodos

A vizinhança de métodos relacionados — selecione um nó para explorar.

Fontes

  1. Vaswani, A. et al. (2017). Attention Is All You Need. NeurIPS. link
  2. Devlin, J. et al. (2019). BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. NAACL. link

Como citar esta página

ScholarGate. (2026, June 1). Multi-Head Self-Attention (Transformer Core). ScholarGate. https://scholargate.app/pt/deep-learning/self-attention-transformer

Qual método?

Coloque este método ao lado dos seus pares mais próximos e leia-os lado a lado — a biblioteca dispõe os livros sobre a mesa; a escolha é sua.

Comparar lado a lado

Referenciado por

ScholarGateSelf-Attention (Multi-Head Self-Attention (Transformer Core)). Recuperado em 2026-06-15 de https://scholargate.app/pt/deep-learning/self-attention-transformer · Conjunto de dados: https://doi.org/10.5281/zenodo.20539026