ScholarGate
Asisten
Machine learningDeep learning / NLP / CV

Transformer yang dilatih mandiri

Transformer yang dilatih mandiri adalah jaringan Transformer yang dilatih sebelumnya menggunakan sinyal supervisi yang dibangun secara otomatis — seperti prediksi token yang ditutupi (masked token prediction) atau prediksi kalimat berikutnya (next-sentence prediction) — alih-alih label yang dianotasi manusia. Representasi yang dihasilkan kemudian disesuaikan (fine-tuned) atau diuji (probed) pada tugas hilir (downstream tasks). BERT, GPT, dan ViT (Vision Transformer dalam mode pemodelan gambar yang ditutupi) adalah instansiasi paling terkenal dari paradigma ini.

Buka di MethodMindSegeraVideoSegeraDownload slides

Baca metode selengkapnya

Khusus anggota

Masuk dengan akun gratis untuk membaca bagian ini.

Masuk

Method map

The neighbourhood of related methods — select a node to explore.

Sumber

  1. Devlin, J., Chang, M.-W., Lee, K., & Toutanova, K. (2019). BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. Proceedings of NAACL-HLT 2019, 4171–4186. DOI: 10.18653/v1/N19-1423
  2. Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., Kaiser, L., & Polosukhin, I. (2017). Attention Is All You Need. Advances in Neural Information Processing Systems, 30. link

Cara menyitasi halaman ini

ScholarGate. (2026, June 3). Self-supervised Transformer (Pretraining with Self-generated Supervision). ScholarGate. https://scholargate.app/id/deep-learning/self-supervised-transformer

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Dirujuk oleh

ScholarGateSelf-supervised Transformer (Self-supervised Transformer (Pretraining with Self-generated Supervision)). Diakses 2026-06-15 dari https://scholargate.app/id/deep-learning/self-supervised-transformer · Set data: https://doi.org/10.5281/zenodo.20539026