Machine learningDeep learning / NLP / CV

多言語Doc2Vec

多言語Doc2Vecは、LeとMikolov (2014) によるParagraph Vectorフレームワークを2つ以上の言語に拡張したもので、意味的に類似した文書が言語に関わらず近くに配置されるように、共有またはアラインされたベクトル空間で文書レベルの埋め込みを学習します。これにより、並列コーパスや翻訳を必要とせずに、多言語文書検索、分類、クラスタリングが可能になります。

MethodMindで開く近日公開動画近日公開Download slides

手法の全文を読む

会員限定

無料アカウントでログインすると、このセクションを読めます。

ログイン

Method map

The neighbourhood of related methods — select a node to explore.

出典

  1. Le, Q., & Mikolov, T. (2014). Distributed representations of sentences and documents. In Proceedings of the 31st International Conference on Machine Learning (ICML), PMLR 32(2), 1188–1196. link
  2. Multilingualism. Wikipedia. link

このページの引用方法

ScholarGate. (2026, June 3). Multilingual Paragraph Vector (Doc2Vec) Model. ScholarGate. https://scholargate.app/ja/deep-learning/multilingual-doc2vec

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side
ScholarGateMultilingual Doc2Vec (Multilingual Paragraph Vector (Doc2Vec) Model). 2026-06-15に以下より取得 https://scholargate.app/ja/deep-learning/multilingual-doc2vec · データセット: https://doi.org/10.5281/zenodo.20539026