Machine learningDeep learning / NLP / CV

Meertalige Doc2Vec

Meertalige Doc2Vec breidt het Paragraph Vector-raamwerk van Le en Mikolov (2014) uit naar twee of meer talen, door document-niveau embeddings te trainen in een gedeelde of uitgelijnde vectorruimte, zodat semantisch vergelijkbare documenten — ongeacht hun taal — dicht bij elkaar eindigen. Het maakt cross-linguale documentretrieval, -classificatie en -clustering mogelijk zonder parallelle corpora of vertaling te vereisen.

Openen in MethodMindBinnenkortVideoBinnenkortDownload slides

Lees de volledige methode

Alleen voor leden

Inloggen

Method map

The neighbourhood of related methods — select a node to explore.

Meertalige Doc2Vec

LDA-onderwerpmodel Meertalige Zins-Embeddin…Multilinguïstische Trans…Sentence Embeddings

Bronnen

Le, Q., & Mikolov, T. (2014). Distributed representations of sentences and documents. In Proceedings of the 31st International Conference on Machine Learning (ICML), PMLR 32(2), 1188–1196. link ↗
Multilingualism. Wikipedia. link ↗

Deze pagina citeren

ScholarGate. (2026, June 3). Multilingual Paragraph Vector (Doc2Vec) Model. ScholarGate. https://scholargate.app/nl/deep-learning/multilingual-doc2vec

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

LDA-onderwerpmodelDeep learning↔ compare
Meertalige Zins-EmbeddingsDeep learning↔ compare
Multilinguïstische TransformerDeep learning↔ compare
Sentence EmbeddingsDeep learning↔ compare

Compare side by side →

Een fout op deze pagina gezien? Meld het of stel een correctie voor →