ScholarGate
Assistent
Machine learningDeep learning / NLP / CV

Meertalige Doc2Vec

Meertalige Doc2Vec breidt het Paragraph Vector-raamwerk van Le en Mikolov (2014) uit naar twee of meer talen, door document-niveau embeddings te trainen in een gedeelde of uitgelijnde vectorruimte, zodat semantisch vergelijkbare documenten — ongeacht hun taal — dicht bij elkaar eindigen. Het maakt cross-linguale documentretrieval, -classificatie en -clustering mogelijk zonder parallelle corpora of vertaling te vereisen.

Openen in MethodMindBinnenkortVideoBinnenkortDownload slides

Lees de volledige methode

Alleen voor leden

Log in met een gratis account om dit onderdeel te lezen.

Inloggen

Method map

The neighbourhood of related methods — select a node to explore.

Bronnen

  1. Le, Q., & Mikolov, T. (2014). Distributed representations of sentences and documents. In Proceedings of the 31st International Conference on Machine Learning (ICML), PMLR 32(2), 1188–1196. link
  2. Multilingualism. Wikipedia. link

Deze pagina citeren

ScholarGate. (2026, June 3). Multilingual Paragraph Vector (Doc2Vec) Model. ScholarGate. https://scholargate.app/nl/deep-learning/multilingual-doc2vec

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side
ScholarGateMultilingual Doc2Vec (Multilingual Paragraph Vector (Doc2Vec) Model). Geraadpleegd op 2026-06-15 via https://scholargate.app/nl/deep-learning/multilingual-doc2vec · Gegevensset: https://doi.org/10.5281/zenodo.20539026