ScholarGate
Assistente
Machine learningDeep learning / NLP / CV

Transformer semi-supervisionato

L'apprendimento semi-supervisionato con architetture Transformer sfrutta grandi quantità di dati non etichettati insieme a un piccolo set etichettato per addestrare potenti modelli di sequenza. Il modello dominante — esemplificato da BERT — pre-addestra prima il Transformer su dati non etichettati utilizzando obiettivi auto-supervisionati come la predizione di token mascherati, quindi lo affina (fine-tunes) sul task etichettato. Questo approccio a due stadi riduce drasticamente i dati etichettati necessari per ottenere prestazioni elevate.

Apri in MethodMindIn arrivoVideoIn arrivoDownload slides

Leggi il metodo completo

Riservato ai membri

Accedi con un account gratuito per leggere questa sezione.

Accedi

Method map

The neighbourhood of related methods — select a node to explore.

+5 more

Fonti

  1. Devlin, J., Chang, M.-W., Lee, K., & Toutanova, K. (2019). BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. Proceedings of NAACL-HLT 2019, 4171–4186. DOI: 10.18653/v1/N19-1423
  2. Zoph, B., Ghiasi, G., Lin, T.-Y., Cui, Y., Liu, H., Cubuk, E. D., & Le, Q. V. (2020). Rethinking Pre-training and Self-training. Advances in Neural Information Processing Systems (NeurIPS), 33, 3833–3845. link

Come citare questa pagina

ScholarGate. (2026, June 3). Semi-supervised Learning with Transformer Architectures. ScholarGate. https://scholargate.app/it/deep-learning/semi-supervised-transformer

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Citato da

ScholarGateSemi-supervised Transformer (Semi-supervised Learning with Transformer Architectures). Consultato il 2026-06-15 da https://scholargate.app/it/deep-learning/semi-supervised-transformer · Insieme di dati: https://doi.org/10.5281/zenodo.20539026