Transformer Separa-Seliaan
Pembelajaran separa-seliaan dengan seni bina Transformer memanfaatkan sejumlah besar data tidak berlabel bersama set berlabel yang kecil untuk melatih model jujukan yang berkuasa. Corak dominan — yang dicontohi oleh BERT — mula-mula melatih awal Transformer pada data tidak berlabel menggunakan objektif separa-seliaan seperti ramalan token bertopeng, kemudian menala halus pada tugas berlabel. Pendekatan dua peringkat ini secara mendadak mengurangkan data berlabel yang diperlukan untuk mencapai prestasi yang kukuh.
Baca kaedah sepenuhnya
Log masuk dengan akaun percuma untuk membaca bahagian ini.
Method map
The neighbourhood of related methods — select a node to explore.
+5 more
Sumber
- Devlin, J., Chang, M.-W., Lee, K., & Toutanova, K. (2019). BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. Proceedings of NAACL-HLT 2019, 4171–4186. DOI: 10.18653/v1/N19-1423 ↗
- Zoph, B., Ghiasi, G., Lin, T.-Y., Cui, Y., Liu, H., Cubuk, E. D., & Le, Q. V. (2020). Rethinking Pre-training and Self-training. Advances in Neural Information Processing Systems (NeurIPS), 33, 3833–3845. link ↗
Cara memetik halaman ini
ScholarGate. (2026, June 3). Semi-supervised Learning with Transformer Architectures. ScholarGate. https://scholargate.app/ms/deep-learning/semi-supervised-transformer
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Klasifikasi Berasaskan BERTPembelajaran Mendalam↔ compare
- Transformer yang Ditalar HalusPembelajaran Mendalam↔ compare
- Klasifikasi Berasaskan RoBERTaPembelajaran Mendalam↔ compare
- Transformer kendiri-terlarasPembelajaran Mendalam↔ compare
- Rangkaian Saraf Konvolusional Separuh-TerawasiPembelajaran Mendalam↔ compare
Dirujuk oleh
Terjumpa masalah pada halaman ini? Laporkan atau cadangkan pembetulan →