Machine learningDeep learning / NLP / CV
다국어 문장 임베딩
다국어 문장 임베딩은 여러 언어의 문장을 단일 공유 벡터 공간으로 매핑하여 의미상 동등한 문장들이 언어에 상관없이 서로 가깝게 위치하도록 합니다. LaBSE, 다국어 Sentence-BERT, mUSE와 같은 모델들은 번역 없이 50~100개 이상의 언어에 걸쳐 텍스트를 비교, 검색, 분류하는 것을 실용적으로 만들었습니다.
방법 전문 읽기
회원 전용
로그인무료 계정으로 로그인하면 이 섹션을 읽을 수 있습니다.
Method map
The neighbourhood of related methods — select a node to explore.
+9 more
출처
- Reimers, N. & Gurevych, I. (2020). Making Monolingual Sentence Embeddings Multilingual using Knowledge Distillation. Proceedings of EMNLP 2020, 4512–4525. link ↗
- Feng, F., Yang, Y., Cer, D., Arivazhagan, N. & Wang, W. (2022). Language-agnostic BERT Sentence Embedding. Proceedings of ACL 2022, 878–891. DOI: 10.18653/v1/2022.acl-long.62 ↗
이 페이지 인용 방법
ScholarGate. (2026, June 3). Multilingual Sentence Embeddings (Cross-lingual Dense Representations). ScholarGate. https://scholargate.app/ko/deep-learning/multilingual-sentence-embeddings
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- BERT 기반 분류딥러닝↔ compare
- 다국어 RoBERTa 기반 분류딥러닝↔ compare
- 다국어 트랜스포머딥러닝↔ compare
- 문장 임베딩딥러닝↔ compare
- 문장 임베딩을 이용한 전이 학습딥러닝↔ compare