ScholarGate
Assistente
Machine learningDeep learning / NLP / CV

Doc2Vec Multilíngue

O Doc2Vec Multilíngue estende a estrutura do Paragraph Vector de Le e Mikolov (2014) para duas ou mais línguas, treinando embeddings em nível de documento em um espaço vetorial compartilhado ou alinhado, de modo que documentos semanticamente semelhantes — independentemente de sua língua — fiquem próximos. Ele permite a recuperação, classificação e agrupamento de documentos entre línguas sem a necessidade de corpora paralelos ou tradução.

Abrir no MethodMindEm breveVídeoEm breveDownload slides

Leia o método completo

Exclusivo para membros

Entre com uma conta gratuita para ler esta seção.

Entrar

Method map

The neighbourhood of related methods — select a node to explore.

Fontes

  1. Le, Q., & Mikolov, T. (2014). Distributed representations of sentences and documents. In Proceedings of the 31st International Conference on Machine Learning (ICML), PMLR 32(2), 1188–1196. link
  2. Multilingualism. Wikipedia. link

Como citar esta página

ScholarGate. (2026, June 3). Multilingual Paragraph Vector (Doc2Vec) Model. ScholarGate. https://scholargate.app/pt/deep-learning/multilingual-doc2vec

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side
ScholarGateMultilingual Doc2Vec (Multilingual Paragraph Vector (Doc2Vec) Model). Recuperado em 2026-06-15 de https://scholargate.app/pt/deep-learning/multilingual-doc2vec · Conjunto de dados: https://doi.org/10.5281/zenodo.20539026