Machine learningDeep learning / NLP / CV

[UNTRANSLATED]

Multilingual Doc2Vec расширяет фреймворк Paragraph Vector (Le и Mikolov, 2014) на два или более языков, обучая эмбеддинги на уровне документов в общем или выровненном векторном пространстве так, чтобы семантически схожие документы — независимо от их языка — оказались близко друг к другу. Это позволяет осуществлять кросс-язычный поиск, классификацию и кластеризацию документов без необходимости использования параллельных корпусов или перевода.

Открыть в MethodMindСкороВидеоСкороDownload slides

Читать метод полностью

Только для участников

Войдите с бесплатным аккаунтом, чтобы прочитать этот раздел.

Войти

Method map

The neighbourhood of related methods — select a node to explore.

Источники

  1. Le, Q., & Mikolov, T. (2014). Distributed representations of sentences and documents. In Proceedings of the 31st International Conference on Machine Learning (ICML), PMLR 32(2), 1188–1196. link
  2. Multilingualism. Wikipedia. link

Как цитировать эту страницу

ScholarGate. (2026, June 3). Multilingual Paragraph Vector (Doc2Vec) Model. ScholarGate. https://scholargate.app/ru/deep-learning/multilingual-doc2vec

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side
ScholarGateMultilingual Doc2Vec (Multilingual Paragraph Vector (Doc2Vec) Model). Получено 2026-06-15 из https://scholargate.app/ru/deep-learning/multilingual-doc2vec · Набор данных: https://doi.org/10.5281/zenodo.20539026