Vícejazyčná vektorová reprezentace vět
Vícejazyčné vektorové reprezentace vět (multilingual sentence embeddings) mapují věty z mnoha jazyků do jediného sdíleného vektorového prostoru tak, aby sémanticky ekvivalentní věty – bez ohledu na jazyk – byly umístěny blízko sebe. Modely jako LaBSE, vícejazyčný Sentence-BERT a mUSE umožnily prakticky porovnávat, vyhledávat a klasifikovat text napříč 50 až 100+ jazyky, aniž by bylo nutné cokoli předem překládat.
Přečíst celou metodu
Pro přečtení této sekce se přihlaste s bezplatným účtem.
Method map
The neighbourhood of related methods — select a node to explore.
+9 more
Zdroje
- Reimers, N. & Gurevych, I. (2020). Making Monolingual Sentence Embeddings Multilingual using Knowledge Distillation. Proceedings of EMNLP 2020, 4512–4525. link ↗
- Feng, F., Yang, Y., Cer, D., Arivazhagan, N. & Wang, W. (2022). Language-agnostic BERT Sentence Embedding. Proceedings of ACL 2022, 878–891. DOI: 10.18653/v1/2022.acl-long.62 ↗
Jak citovat tuto stránku
ScholarGate. (2026, June 3). Multilingual Sentence Embeddings (Cross-lingual Dense Representations). ScholarGate. https://scholargate.app/cs/deep-learning/multilingual-sentence-embeddings
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Klasifikace založená na BERTHluboké učení↔ compare
- Klasifikace založená na vícejazyčné RoBERTaHluboké učení↔ compare
- Vícejazyčný transformerHluboké učení↔ compare
- Vektorové reprezentace větHluboké učení↔ compare
- Přenosové učení se vnořováním větHluboké učení↔ compare
Odkazuje sem
Našli jste na této stránce chybu? Nahlaste ji nebo navrhněte opravu →