Machine learning

Autoatenção Multi-Cabeça

A autoatenção multi-cabeça (multi-head self-attention), introduzida por Vaswani e colegas em 2017, é o mecanismo que permite que cada posição em uma sequência calcule sua relação com todas as outras posições em paralelo. É o cerne da arquitetura Transformer e a base subjacente a BERT, GPT e T5.

Abrir no MethodMindEm breveVídeoEm breveBaixar slides

Leia o método completo

Exclusivo para membros

Entre com uma conta gratuita para ler esta seção.

Entrar

Mapa de métodos

A vizinhança de métodos relacionados — selecione um nó para explorar.

Autoatenção Multi-Cabeça

Ajuste Fino de BERT GPT Fine-Tuning LoRA e PEFT Random Forest XGBoost Mecanismo de Atenção RNN Bidirecional Geração Aumentada por Re…Modelo Sequência-para-Se…

Fontes

Vaswani, A. et al. (2017). Attention Is All You Need. NeurIPS. link ↗
Devlin, J. et al. (2019). BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. NAACL. link ↗

Como citar esta página

ScholarGate. (2026, June 1). Multi-Head Self-Attention (Transformer Core). ScholarGate. https://scholargate.app/pt/deep-learning/self-attention-transformer

Qual método?

Coloque este método ao lado dos seus pares mais próximos e leia-os lado a lado — a biblioteca dispõe os livros sobre a mesa; a escolha é sua.

Ajuste Fino de BERTAprendizado profundo↔ comparar
GPT Fine-TuningAprendizado profundo↔ comparar
LoRA e PEFTAprendizado profundo↔ comparar
Random ForestAprendizado de máquina↔ comparar
XGBoostAprendizado de máquina↔ comparar

Comparar lado a lado →

Referenciado por

Mecanismo de Atenção RNN Bidirecional Geração Aumentada por Recuperação (RAG)Modelo Sequência-para-Sequência

Encontrou um problema nesta página? Relate ou sugira uma correção →

Leia o método completo

Mapa de métodos

Fontes

Como citar esta página

Métodos relacionados

Qual método?

Referenciado por