Machine learningDeep learning / NLP / CV

Vision Transformer multilingue

Le Vision Transformer multilingue (Multilingual ViT) étend l'architecture Vision Transformer pour fonctionner dans plusieurs langues, permettant la compréhension d'images et le raisonnement image-texte dans des contextes multilingues ou translingues. Il combine un encodage d'image basé sur des patchs avec des représentations textuelles multilingues, permettant à un seul modèle de servir diverses communautés linguistiques pour des tâches telles que le sous-titrage d'images, la réponse visuelle aux questions et la récupération d'images translingue.

Ouvrir dans MethodMindBientôtVidéoBientôtDownload slides

Lire la méthode complète

Réservé aux membres

Connectez-vous avec un compte gratuit pour lire cette section.

Se connecter

Method map

The neighbourhood of related methods — select a node to explore.

Sources

  1. Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. International Conference on Learning Representations (ICLR 2021). link
  2. Bugliarello, E., Liu, F., Pfeiffer, J., Reddy, S., Elliott, D., Erdem, E., Erdem, A., & Lukasiewicz, T. (2022). IGLUE: A Benchmark for Transfer Learning across Modalities, Tasks, and Languages. International Conference on Machine Learning (ICML 2022). link

Comment citer cette page

ScholarGate. (2026, June 3). Multilingual Vision Transformer (Multilingual ViT). ScholarGate. https://scholargate.app/fr/deep-learning/multilingual-vision-transformer

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Référencée par

ScholarGateMultilingual vision transformer (Multilingual Vision Transformer (Multilingual ViT)). Consulté le 2026-06-15 sur https://scholargate.app/fr/deep-learning/multilingual-vision-transformer · Jeu de données : https://doi.org/10.5281/zenodo.20539026