Machine learning

Autoatención Multi-cabeza

La autoatención multi-cabeza, introducida por Vaswani y colegas en 2017, es el mecanismo que permite a cada posición en una secuencia computar su relación con todas las demás posiciones en paralelo. Es el núcleo de la arquitectura Transformer y la base de BERT, GPT y T5.

Abrir en MethodMindPróximamenteVídeoPróximamenteDescargar diapositivas

Leer el método completo

Solo para miembros

Inicia sesión con una cuenta gratuita para leer esta sección.

Iniciar sesión

Mapa de métodos

El vecindario de métodos relacionados: selecciona un nodo para explorarlo.

Autoatención Multi-cabeza

Ajuste fino de BERT Ajuste fino de GPT LoRA y PEFT Random Forest XGBoost Mecanismo de atención RNN bidireccional Generación Aumentada por…Modelo Secuencia-a-Secue…

Fuentes

Vaswani, A. et al. (2017). Attention Is All You Need. NeurIPS. link ↗
Devlin, J. et al. (2019). BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. NAACL. link ↗

Cómo citar esta página

ScholarGate. (2026, June 1). Multi-Head Self-Attention (Transformer Core). ScholarGate. https://scholargate.app/es/deep-learning/self-attention-transformer

¿Qué método?

Coloca este método junto a sus parientes más cercanos y léelos lado a lado: la biblioteca pone los libros sobre la mesa; la elección es tuya.

Ajuste fino de BERTAprendizaje profundo↔ comparar
Ajuste fino de GPTAprendizaje profundo↔ comparar
LoRA y PEFTAprendizaje profundo↔ comparar
Random ForestAprendizaje automático↔ comparar
XGBoostAprendizaje automático↔ comparar

Comparar lado a lado →

Citado por

Mecanismo de atención RNN bidireccional Generación Aumentada por Recuperación (RAG)Modelo Secuencia-a-Secuencia

¿Has visto un problema en esta página? Infórmanos o sugiere una corrección →

Leer el método completo

Mapa de métodos

Fuentes

Cómo citar esta página

Métodos relacionados

¿Qué método?

Citado por