Machine learningDeep learning / NLP / CV

Ασθενώς επιβλεπόμενος Μετασχηματιστής Όρασης

Ο Ασθενώς Επιβλεπόμενος Μετασχηματιστής Όρασης (WS-ViT) εκπαιδεύει έναν Μετασχηματιστή Όρασης σε δεδομένα εικόνων που στερούνται ακριβών επισημάνσεων σε επίπεδο εικονοστοιχείου, χρησιμοποιώντας αντ' αυτού φθηνότερη, πιο θορυβώδη επίβλεψη, όπως ετικέτες κλάσης σε επίπεδο εικόνας, πλαίσια οριοθέτησης ή κείμενο που έχει συλλεχθεί από το διαδίκτυο. Ο μηχανισμός καθολικής αυτο-προσοχής του μετασχηματιστή τον καθιστά ιδιαίτερα ικανό στην εντοπισμό αντικειμένων και στην εκμάθηση διακριτικών χαρακτηριστικών από αυτές τις ελλιπείς ετικέτες.

Άνοιγμα στο MethodMindΣύντομαΒίντεοΣύντομαDownload slides

Διαβάστε ολόκληρη τη μέθοδο

Μόνο για μέλη

Συνδεθείτε με δωρεάν λογαριασμό για να διαβάσετε αυτή την ενότητα.

Σύνδεση

Method map

The neighbourhood of related methods — select a node to explore.

Πηγές

  1. Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An image is worth 16x16 words: Transformers for image recognition at scale. In International Conference on Learning Representations (ICLR). link
  2. Zhou, Z.-H. (2022). A brief introduction to weakly supervised learning. National Science Review, 5(1), 44–53. DOI: 10.1093/nsr/nwx106

Πώς να παραπέμψετε σε αυτή τη σελίδα

ScholarGate. (2026, June 3). Weakly Supervised Vision Transformer (WS-ViT). ScholarGate. https://scholargate.app/el/deep-learning/weakly-supervised-vision-transformer

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side
ScholarGateWeakly supervised vision transformer (Weakly Supervised Vision Transformer (WS-ViT)). Ανακτήθηκε στις 2026-06-15 από https://scholargate.app/el/deep-learning/weakly-supervised-vision-transformer · Σύνολο δεδομένων: https://doi.org/10.5281/zenodo.20539026