Machine learningDeep learning / NLP / CV
多语言句子嵌入
多语言句子嵌入将多种语言的句子映射到单个共享向量空间,使得语义等价的句子——无论语言如何——都能近距离对齐。像LaBSE、多语言Sentence-BERT和mUSE这样的模型使得在不进行任何翻译的情况下,跨越50至100多种语言进行文本比较、检索和分类成为可能。
阅读完整方法
仅限会员
登录使用免费账户登录即可阅读本节。
方法图谱
相关方法的邻域——选择一个节点以展开探索。
另有 9 项
来源
- Reimers, N. & Gurevych, I. (2020). Making Monolingual Sentence Embeddings Multilingual using Knowledge Distillation. Proceedings of EMNLP 2020, 4512–4525. link ↗
- Feng, F., Yang, Y., Cer, D., Arivazhagan, N. & Wang, W. (2022). Language-agnostic BERT Sentence Embedding. Proceedings of ACL 2022, 878–891. DOI: 10.18653/v1/2022.acl-long.62 ↗
如何引用本页
ScholarGate. (2026, June 3). Multilingual Sentence Embeddings (Cross-lingual Dense Representations). ScholarGate. https://scholargate.app/zh/deep-learning/multilingual-sentence-embeddings
选用哪种方法?
将本方法与其最相近的同类并置,并排研读——本馆将书籍铺陈于案上,取舍则由您定夺。
- [需翻译标题:BERT-based Classification...]深度学习↔ 比较
- 基于多语言 RoBERTa 的分类深度学习↔ 比较
- 多语言 Transformer深度学习↔ 比较
- 句子嵌入深度学习↔ 比较
- 基于句子嵌入的迁移学习深度学习↔ 比较