Machine learningDeep learning / NLP / CV

Viacjazyčný Doc2Vec

Viacjazyčný Doc2Vec rozširuje rámec Paragraph Vector od Le a Mikolova (2014) na dva alebo viac jazykov, pričom trénuje vloženia na úrovni dokumentov v zdieľanom alebo zarovnanom vektorovom priestore tak, aby sémanticky podobné dokumenty – bez ohľadu na ich jazyk – skončili blízko seba. Umožňuje viacjazyčné vyhľadávanie, klasifikáciu a zhlukovanie dokumentov bez potreby paralelných korpusov alebo prekladu.

Otvoriť v MethodMindČoskoroVideoČoskoroDownload slides

Prečítať celú metódu

Len pre členov

Ak si chcete prečítať túto sekciu, prihláste sa s bezplatným účtom.

Prihlásiť sa

Method map

The neighbourhood of related methods — select a node to explore.

Zdroje

  1. Le, Q., & Mikolov, T. (2014). Distributed representations of sentences and documents. In Proceedings of the 31st International Conference on Machine Learning (ICML), PMLR 32(2), 1188–1196. link
  2. Multilingualism. Wikipedia. link

Ako citovať túto stránku

ScholarGate. (2026, June 3). Multilingual Paragraph Vector (Doc2Vec) Model. ScholarGate. https://scholargate.app/sk/deep-learning/multilingual-doc2vec

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side
ScholarGateMultilingual Doc2Vec (Multilingual Paragraph Vector (Doc2Vec) Model). Získané 2026-06-15 z https://scholargate.app/sk/deep-learning/multilingual-doc2vec · Dátová sada: https://doi.org/10.5281/zenodo.20539026