Machine learningDeep learning / NLP / CV

Vícejazyčný Doc2Vec

Vícejazyčný Doc2Vec rozšiřuje rámec Paragraph Vector Le a Mikolova (2014) na dva nebo více jazyků, trénuje vnoření na úrovni dokumentů ve sdíleném nebo zarovnaném vektorovém prostoru tak, aby sémanticky podobné dokumenty — bez ohledu na jejich jazyk — skončily blízko sebe. Umožňuje mezijazykové vyhledávání, klasifikaci a shlukování dokumentů bez nutnosti paralelních korpusů nebo překladu.

Otevřít v MethodMindJiž brzyVideoJiž brzyDownload slides

Přečíst celou metodu

Pouze pro členy

Pro přečtení této sekce se přihlaste s bezplatným účtem.

Přihlásit se

Method map

The neighbourhood of related methods — select a node to explore.

Zdroje

  1. Le, Q., & Mikolov, T. (2014). Distributed representations of sentences and documents. In Proceedings of the 31st International Conference on Machine Learning (ICML), PMLR 32(2), 1188–1196. link
  2. Multilingualism. Wikipedia. link

Jak citovat tuto stránku

ScholarGate. (2026, June 3). Multilingual Paragraph Vector (Doc2Vec) Model. ScholarGate. https://scholargate.app/cs/deep-learning/multilingual-doc2vec

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side
ScholarGateMultilingual Doc2Vec (Multilingual Paragraph Vector (Doc2Vec) Model). Získáno 2026-06-15 z https://scholargate.app/cs/deep-learning/multilingual-doc2vec · Datová sada: https://doi.org/10.5281/zenodo.20539026