Machine learningDeep learning / NLP / CV

Vícejazyčná vektorová reprezentace vět

Vícejazyčné vektorové reprezentace vět (multilingual sentence embeddings) mapují věty z mnoha jazyků do jediného sdíleného vektorového prostoru tak, aby sémanticky ekvivalentní věty – bez ohledu na jazyk – byly umístěny blízko sebe. Modely jako LaBSE, vícejazyčný Sentence-BERT a mUSE umožnily prakticky porovnávat, vyhledávat a klasifikovat text napříč 50 až 100+ jazyky, aniž by bylo nutné cokoli předem překládat.

Otevřít v MethodMindJiž brzyVideoJiž brzyDownload slides

Přečíst celou metodu

Pouze pro členy

Pro přečtení této sekce se přihlaste s bezplatným účtem.

Přihlásit se

Method map

The neighbourhood of related methods — select a node to explore.

+9 more

Zdroje

  1. Reimers, N. & Gurevych, I. (2020). Making Monolingual Sentence Embeddings Multilingual using Knowledge Distillation. Proceedings of EMNLP 2020, 4512–4525. link
  2. Feng, F., Yang, Y., Cer, D., Arivazhagan, N. & Wang, W. (2022). Language-agnostic BERT Sentence Embedding. Proceedings of ACL 2022, 878–891. DOI: 10.18653/v1/2022.acl-long.62

Jak citovat tuto stránku

ScholarGate. (2026, June 3). Multilingual Sentence Embeddings (Cross-lingual Dense Representations). ScholarGate. https://scholargate.app/cs/deep-learning/multilingual-sentence-embeddings

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Odkazuje sem

ScholarGateMultilingual Sentence Embeddings (Multilingual Sentence Embeddings (Cross-lingual Dense Representations)). Získáno 2026-06-15 z https://scholargate.app/cs/deep-learning/multilingual-sentence-embeddings · Datová sada: https://doi.org/10.5281/zenodo.20539026