Transformer semi-supervisado
El aprendizaje semi-supervisado con arquitecturas Transformer aprovecha grandes cantidades de datos no etiquetados junto con un pequeño conjunto etiquetado para entrenar potentes modelos de secuencias. El patrón dominante —ejemplificado por BERT— primero pre-entrena el Transformer con datos no etiquetados utilizando objetivos auto-supervisados como la predicción de tokens enmascarados, y luego lo ajusta finamente (fine-tunes) en la tarea etiquetada. Este enfoque de dos etapas reduce drásticamente los datos etiquetados necesarios para lograr un rendimiento sólido.
Leer el método completo
Inicia sesión con una cuenta gratuita para leer esta sección.
Method map
The neighbourhood of related methods — select a node to explore.
+5 more
Fuentes
- Devlin, J., Chang, M.-W., Lee, K., & Toutanova, K. (2019). BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. Proceedings of NAACL-HLT 2019, 4171–4186. DOI: 10.18653/v1/N19-1423 ↗
- Zoph, B., Ghiasi, G., Lin, T.-Y., Cui, Y., Liu, H., Cubuk, E. D., & Le, Q. V. (2020). Rethinking Pre-training and Self-training. Advances in Neural Information Processing Systems (NeurIPS), 33, 3833–3845. link ↗
Cómo citar esta página
ScholarGate. (2026, June 3). Semi-supervised Learning with Transformer Architectures. ScholarGate. https://scholargate.app/es/deep-learning/semi-supervised-transformer
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Clasificación basada en BERTAprendizaje profundo↔ compare
- Transformer Ajustado FinamenteAprendizaje profundo↔ compare
- Clasificación basada en RoBERTaAprendizaje profundo↔ compare
- Transformer auto-supervisadoAprendizaje profundo↔ compare
- Red Neuronal Convolucional Semi-supervisadaAprendizaje profundo↔ compare
Citado por
¿Has visto un problema en esta página? Infórmanos o sugiere una corrección →