ScholarGate
Assistent
Machine learningDeep learning / NLP / CV

Fler-sproglig Doc2Vec

Fler-sproglig Doc2Vec udvider Paragraph Vector-rammeværket fra Le og Mikolov (2014) til to eller flere sprog, idet der trænes dokument-niveau-indlejringer i et delt eller justeret vektorrum, således at semantisk ensartede dokumenter — uanset deres sprog — ender tæt på hinanden. Det muliggør tværsproglig dokumenthentning, klassifikation og klyngeanalyse uden krav om parallelle korpora eller oversættelse.

Åbn i MethodMindSnartVideoSnartDownload slides

Læs hele metoden

Kun for medlemmer

Log ind med en gratis konto for at læse dette afsnit.

Log ind

Method map

The neighbourhood of related methods — select a node to explore.

Kilder

  1. Le, Q., & Mikolov, T. (2014). Distributed representations of sentences and documents. In Proceedings of the 31st International Conference on Machine Learning (ICML), PMLR 32(2), 1188–1196. link
  2. Multilingualism. Wikipedia. link

Sådan citerer du denne side

ScholarGate. (2026, June 3). Multilingual Paragraph Vector (Doc2Vec) Model. ScholarGate. https://scholargate.app/da/deep-learning/multilingual-doc2vec

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side
ScholarGateMultilingual Doc2Vec (Multilingual Paragraph Vector (Doc2Vec) Model). Hentet 2026-06-15 fra https://scholargate.app/da/deep-learning/multilingual-doc2vec · Datasæt: https://doi.org/10.5281/zenodo.20539026