Machine learningDeep learning / NLP / CV

Transformer semi-supervisado

El aprendizaje semi-supervisado con arquitecturas Transformer aprovecha grandes cantidades de datos no etiquetados junto con un pequeño conjunto etiquetado para entrenar potentes modelos de secuencias. El patrón dominante —ejemplificado por BERT— primero pre-entrena el Transformer con datos no etiquetados utilizando objetivos auto-supervisados como la predicción de tokens enmascarados, y luego lo ajusta finamente (fine-tunes) en la tarea etiquetada. Este enfoque de dos etapas reduce drásticamente los datos etiquetados necesarios para lograr un rendimiento sólido.

Abrir en MethodMindPróximamenteVídeoPróximamenteDownload slides

Leer el método completo

Solo para miembros

Inicia sesión con una cuenta gratuita para leer esta sección.

Iniciar sesión

Method map

The neighbourhood of related methods — select a node to explore.

+5 more

Fuentes

  1. Devlin, J., Chang, M.-W., Lee, K., & Toutanova, K. (2019). BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. Proceedings of NAACL-HLT 2019, 4171–4186. DOI: 10.18653/v1/N19-1423
  2. Zoph, B., Ghiasi, G., Lin, T.-Y., Cui, Y., Liu, H., Cubuk, E. D., & Le, Q. V. (2020). Rethinking Pre-training and Self-training. Advances in Neural Information Processing Systems (NeurIPS), 33, 3833–3845. link

Cómo citar esta página

ScholarGate. (2026, June 3). Semi-supervised Learning with Transformer Architectures. ScholarGate. https://scholargate.app/es/deep-learning/semi-supervised-transformer

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Citado por

ScholarGateSemi-supervised Transformer (Semi-supervised Learning with Transformer Architectures). Recuperado el 2026-06-15 de https://scholargate.app/es/deep-learning/semi-supervised-transformer · Conjunto de datos: https://doi.org/10.5281/zenodo.20539026