Transformer Visi
Transformer Visi (ViT), diperkenalkan oleh Dosovitskiy dan rakan-rakan pada tahun 2021, membahagikan imej kepada tampalan bersaiz tetap, memperlakukannya sebagai urutan, dan menggunakan mekanisme perhatian kendiri Transformer untuk klasifikasi imej. Dengan data latihan yang mencukupi, ia mengatasi rangkaian saraf konvolusional (CNN).
Baca kaedah sepenuhnya
Log masuk dengan akaun percuma untuk membaca bahagian ini.
Method map
The neighbourhood of related methods — select a node to explore.
+27 more
Sumber
Cara memetik halaman ini
ScholarGate. (2026, June 1). Vision Transformer (ViT). ScholarGate. https://scholargate.app/ms/deep-learning/vision-transformer
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Model ResapanPembelajaran Mendalam↔ compare
- Rangkaian Generatif AdversarialPembelajaran Mendalam↔ compare
- Random ForestPembelajaran Mesin↔ compare
- Mesin Vektor Sokongan (Klasifikasi)Pembelajaran Mesin↔ compare
- Autoenkoder VariasiPembelajaran Mendalam↔ compare
Dirujuk oleh
Terjumpa masalah pada halaman ini? Laporkan atau cadangkan pembetulan →