Vision Transformer
Vision Transformer (ViT), yang diperkenalkan oleh Dosovitskiy dan kolega pada tahun 2021, membagi citra menjadi potongan-potongan berukuran tetap, memperlakukan potongan-potongan tersebut sebagai urutan, dan menerapkan mekanisme perhatian diri (self-attention) Transformer untuk klasifikasi citra. Dengan data pelatihan yang cukup, ViT melampaui jaringan saraf konvolusional (CNN).
Baca metode selengkapnya
Masuk dengan akun gratis untuk membaca bagian ini.
Method map
The neighbourhood of related methods — select a node to explore.
+27 more
Sumber
Cara menyitasi halaman ini
ScholarGate. (2026, June 1). Vision Transformer (ViT). ScholarGate. https://scholargate.app/id/deep-learning/vision-transformer
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Model DifusiPembelajaran Mendalam↔ compare
- Jaringan Adversarial GeneratifPembelajaran Mendalam↔ compare
- Random ForestPembelajaran Mesin↔ compare
- Support Vector Machine (Klasifikasi)Pembelajaran Mesin↔ compare
- Variational AutoencoderPembelajaran Mendalam↔ compare
Dirujuk oleh
Menemukan masalah di halaman ini? Laporkan atau usulkan perbaikan →