Transformeur semi-supervisé
L'apprentissage semi-supervisé avec des architectures Transformer exploite de grandes quantités de données non étiquetées aux côtés d'un petit ensemble étiqueté pour entraîner de puissants modèles de séquences. Le schéma dominant — exemplifié par BERT — pré-entraîne d'abord le Transformer sur des données non étiquetées en utilisant des objectifs auto-supervisés tels que la prédiction de jetons masqués, puis l'affine sur la tâche étiquetée. Cette approche en deux étapes réduit considérablement la quantité de données étiquetées nécessaires pour obtenir de solides performances.
Lire la méthode complète
Connectez-vous avec un compte gratuit pour lire cette section.
Method map
The neighbourhood of related methods — select a node to explore.
+5 more
Sources
- Devlin, J., Chang, M.-W., Lee, K., & Toutanova, K. (2019). BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. Proceedings of NAACL-HLT 2019, 4171–4186. DOI: 10.18653/v1/N19-1423 ↗
- Zoph, B., Ghiasi, G., Lin, T.-Y., Cui, Y., Liu, H., Cubuk, E. D., & Le, Q. V. (2020). Rethinking Pre-training and Self-training. Advances in Neural Information Processing Systems (NeurIPS), 33, 3833–3845. link ↗
Comment citer cette page
ScholarGate. (2026, June 3). Semi-supervised Learning with Transformer Architectures. ScholarGate. https://scholargate.app/fr/deep-learning/semi-supervised-transformer
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Classification basée sur BERTApprentissage profond↔ compare
- Transformer affinéApprentissage profond↔ compare
- Classification basée sur RoBERTaApprentissage profond↔ compare
- Transformer auto-superviséApprentissage profond↔ compare
- CNN convolutive semi-superviséeApprentissage profond↔ compare
Référencée par
Une erreur sur cette page ? Signalez-la ou proposez une correction →