Machine learningDeep learning / NLP / CV

多言語画像分類

多言語画像分類は、クラス名、教師信号、または評価ベンチマークが複数の言語にまたがる場合に、画像を認識およびラベル付けするための視覚モデルをトレーニングします。CLIPのような多言語の視覚言語モデルによって可能になり、単一のモデルでサポートされている任意の言語のプロンプトまたはラベルを使用して画像を分類できるため、コンピュータビジョンシステムの異文化間およびクロスリンガルの展開が容易になります。

MethodMindで開く近日公開動画近日公開Download slides

手法の全文を読む

会員限定

無料アカウントでログインすると、このセクションを読めます。

ログイン

Method map

The neighbourhood of related methods — select a node to explore.

出典

  1. Radford, A., Kim, J. W., Hallacy, C., Ramesh, A., Goh, G., Agarwal, S., ... & Sutskever, I. (2021). Learning transferable visual models from natural language supervision. In Proceedings of the 38th International Conference on Machine Learning (ICML), pp. 8748–8763. PMLR. link
  2. Image classification. Wikipedia. link

このページの引用方法

ScholarGate. (2026, June 3). Multilingual Image Classification (Cross-Lingual Vision Model). ScholarGate. https://scholargate.app/ja/deep-learning/multilingual-image-classification

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side
ScholarGateMultilingual Image Classification (Multilingual Image Classification (Cross-Lingual Vision Model)). 2026-06-15に以下より取得 https://scholargate.app/ja/deep-learning/multilingual-image-classification · データセット: https://doi.org/10.5281/zenodo.20539026