Machine learningDeep learning / NLP / CV

[UNTRANSLATED]

Multilingual Doc2Vec расширяет фреймворк Paragraph Vector (Le и Mikolov, 2014) на два или более языков, обучая эмбеддинги на уровне документов в общем или выровненном векторном пространстве так, чтобы семантически схожие документы — независимо от их языка — оказались близко друг к другу. Это позволяет осуществлять кросс-язычный поиск, классификацию и кластеризацию документов без необходимости использования параллельных корпусов или перевода.

Открыть в MethodMindСкороВидеоСкороDownload slides

Читать метод полностью

Только для участников

Войдите с бесплатным аккаунтом, чтобы прочитать этот раздел.

Войти

Method map

The neighbourhood of related methods — select a node to explore.

[UNTRANSLATED]

Тематическая модель LDA Многоязычные вложения пр…Мультиязычный трансформер Векторные представления…

Источники

Le, Q., & Mikolov, T. (2014). Distributed representations of sentences and documents. In Proceedings of the 31st International Conference on Machine Learning (ICML), PMLR 32(2), 1188–1196. link ↗
Multilingualism. Wikipedia. link ↗

Как цитировать эту страницу

ScholarGate. (2026, June 3). Multilingual Paragraph Vector (Doc2Vec) Model. ScholarGate. https://scholargate.app/ru/deep-learning/multilingual-doc2vec

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Тематическая модель LDAГлубокое обучение↔ compare
Многоязычные вложения предложенийГлубокое обучение↔ compare
Мультиязычный трансформерГлубокое обучение↔ compare
Векторные представления предложенийГлубокое обучение↔ compare

Compare side by side →

Нашли ошибку на этой странице? Сообщите о ней или предложите исправление →