Machine learningDeep learning / NLP / CV

Multilingual Doc2Vec

Multilingual Doc2Vec estén el marc del Paragraph Vector de Le i Mikolov (2014) a dues o més llengües, entrenant embeddings a nivell de document en un espai vectorial compartit o alineat, de manera que documents semànticament similars, independentment de la seva llengua, acabin a prop. Permet la recuperació, classificació i agrupació de documents cross-lingües sense necessitat de corpus paral·lels ni traducció.

Obre a MethodMindAviatVídeoAviatDownload slides

Llegeix el mètode complet

Només per a membres

Inicia la sessió amb un compte gratuït per llegir aquesta secció.

Inicia la sessió

Method map

The neighbourhood of related methods — select a node to explore.

Multilingual Doc2Vec

Model de temes LDA Vectors de sentències mu…Transformer multilingüe Sentence Embeddings

Fonts

Le, Q., & Mikolov, T. (2014). Distributed representations of sentences and documents. In Proceedings of the 31st International Conference on Machine Learning (ICML), PMLR 32(2), 1188–1196. link ↗
Multilingualism. Wikipedia. link ↗

Com citar aquesta pàgina

ScholarGate. (2026, June 3). Multilingual Paragraph Vector (Doc2Vec) Model. ScholarGate. https://scholargate.app/ca/deep-learning/multilingual-doc2vec

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Model de temes LDAAprenentatge profund↔ compare
Vectors de sentències multilingüesAprenentatge profund↔ compare
Transformer multilingüeAprenentatge profund↔ compare
Sentence EmbeddingsAprenentatge profund↔ compare

Compare side by side →

Has vist cap problema en aquesta pàgina? Informa'n o suggereix una correcció →