Semi-superviseret Transformer
Semi-superviseret læring med Transformer-arkitekturer udnytter store mængder umærket data sammen med et lille mærket datasæt til at træne kraftfulde sekvensmodeller. Det dominerende mønster – eksemplificeret ved BERT – fortræner først Transformer'en på umærket data ved hjælp af selv-superviserede mål, såsom maskeret token-forudsigelse, og finjusterer den derefter på den mærkede opgave. Denne to-trins tilgang reducerer dramatisk den mærkede data, der er nødvendig for at opnå stærk ydeevne.
Læs hele metoden
Log ind med en gratis konto for at læse dette afsnit.
Method map
The neighbourhood of related methods — select a node to explore.
+5 more
Kilder
- Devlin, J., Chang, M.-W., Lee, K., & Toutanova, K. (2019). BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. Proceedings of NAACL-HLT 2019, 4171–4186. DOI: 10.18653/v1/N19-1423 ↗
- Zoph, B., Ghiasi, G., Lin, T.-Y., Cui, Y., Liu, H., Cubuk, E. D., & Le, Q. V. (2020). Rethinking Pre-training and Self-training. Advances in Neural Information Processing Systems (NeurIPS), 33, 3833–3845. link ↗
Sådan citerer du denne side
ScholarGate. (2026, June 3). Semi-supervised Learning with Transformer Architectures. ScholarGate. https://scholargate.app/da/deep-learning/semi-supervised-transformer
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- BERT-baseret klassifikationDyb læring↔ compare
- Fintunet TransformerDyb læring↔ compare
- RoBERTa-baseret KlassifikationDyb læring↔ compare
- Selv-overvåget TransformerDyb læring↔ compare
- Semi-overvåget Convolutional Neural NetworkDyb læring↔ compare
Refereret af
Har du fundet en fejl på denne side? Indberet den eller foreslå en rettelse →