Machine learning

Vision Transformer

A Vision Transformert (ViT), amelyet Dosovitskiy és munkatársai vezettek be 2021-ben, egy képet rögzített méretű foltokra (patch) bont, ezeket a foltokat szekvenciaként kezeli, és a Transformer önfigyelmes (self-attention) mechanizmusát alkalmazza képosztályozásra. Elegendő képzési adat esetén felülmúlja a konvolúciós neurális hálózatokat (CNN).

Megnyitás itt: MethodMindHamarosanVideóHamarosanDownload slides

A teljes módszer elolvasása

Csak tagoknak

Jelentkezzen be ingyenes fiókkal a szakasz elolvasásához.

Bejelentkezés

Method map

The neighbourhood of related methods — select a node to explore.

Vision Transformer

Modell (mélytanulás)Generative Adversarial N…Véletlen erdő Support Vector Machine (…Variációs Autoencoder BERT finomhangolás CLIP Tartományadaptív transzf…Domain-Adaptive Vision T…Magyarázható Vizionáló T…

+27 more

Források

Dosovitskiy, A. et al. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. ICLR. link ↗
Touvron, H. et al. (2021). Training Data-Efficient Image Transformers. ICML. link ↗

Hogyan hivatkozzon erre az oldalra

ScholarGate. (2026, June 1). Vision Transformer (ViT). ScholarGate. https://scholargate.app/hu/deep-learning/vision-transformer

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Modell (mélytanulás)Mélytanulás↔ compare
Generative Adversarial NetworkMélytanulás↔ compare
Véletlen erdőGépi tanulás↔ compare
Support Vector Machine (Osztályozás)Gépi tanulás↔ compare
Variációs AutoencoderMélytanulás↔ compare

Compare side by side →

Hivatkozik rá

BERT finomhangolás CLIP Tartományadaptív transzformer Domain-Adaptive Vision Transformer Magyarázható Vizionáló Transzformer Finomhangolt Vision Transformer GPT finomhangolás Képosztályozás Kolmogorov-Arnold hálózatok LoRA és PEFT Mamba (Állapot-tér modell)Maszkolt Autoenkóderek Multilingual Vision Transformer Multimodális BERT-alapú osztályozás Multimodális NLP Multimodális szemantikus szegmentáció Multimodális transzformer Multimodális Vizuális Transzformer Segment Anything Model Önfelügyelt GAN Önfelügyelt képosztályozás Önfelügyelt példány szegmentáció Önfelügyelt szemantikus szegmentáció Önfelügyelt Vision Transformer Félfelügyelt Vision Transformer SimCLR Térbeli-Időbeli Gráfsűrítési Hálózatok Swin Transformer TimeGPT Vision Mamba Gyengén felügyelt objektumdetektálás Gyengén felügyelt Vision Transformer

Hibát talált ezen az oldalon? Jelentse, vagy javasoljon javítást →

A teljes módszer elolvasása

Method map

Források

Hogyan hivatkozzon erre az oldalra

Kapcsolódó módszerek

Which method?

Hivatkozik rá