Tosproget Billedklassifikation
Tosproget billedklassifikation træner visuelle modeller til at genkende og mærke billeder, når klassenavne, overvågningssignaler eller evalueringsbenchmarks spænder over flere sprog. Muliggjort af tosprogede vision-sprogmodeller som CLIP, tillader det en enkelt model at klassificere billeder ved hjælp af prompts eller etiketter på ethvert understøttet sprog, hvilket letter tværkulturel og tværsproglig implementering af computersynssystemer.
Læs hele metoden
Log ind med en gratis konto for at læse dette afsnit.
Method map
The neighbourhood of related methods — select a node to explore.
Kilder
- Radford, A., Kim, J. W., Hallacy, C., Ramesh, A., Goh, G., Agarwal, S., ... & Sutskever, I. (2021). Learning transferable visual models from natural language supervision. In Proceedings of the 38th International Conference on Machine Learning (ICML), pp. 8748–8763. PMLR. link ↗
- Image classification. Wikipedia. link ↗
Sådan citerer du denne side
ScholarGate. (2026, June 3). Multilingual Image Classification (Cross-Lingual Vision Model). ScholarGate. https://scholargate.app/da/deep-learning/multilingual-image-classification
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- BilledklassifikationDyb læring↔ compare
- Flersprogede sætningsindlejringerDyb læring↔ compare
- Multilingual Vision TransformerDyb læring↔ compare
- Multimodal billedklassifikationDyb læring↔ compare
- Overførselslæring med billedklassifikationDyb læring↔ compare
Har du fundet en fejl på denne side? Indberet den eller foreslå en rettelse →