ScholarGate
עוזר

השוואת שיטות

סקרו את השיטות שבחרתם זו לצד זו; שורות שבהן יש הבדל מודגשות.

מיון מסמכים×דמיון סמנטי×
תחוםכריית טקסטכריית טקסט
משפחהProcess / pipelineProcess / pipeline
שנת המקור2019
הוגה השיטהNils Reimers & Iryna Gurevych (Sentence-BERT)
סוגUnsupervised text-mining taskNLP text-comparison task
מקור מכונןAggarwal, C. C. & Zhai, C. (2012). Mining Text Data. Springer. ISBN: 9781461432227Reimers, N. & Gurevych, I. (2019). Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks. EMNLP. link ↗
כינוייםtext clustering, unsupervised text grouping, Belge Kümeleme (Document Clustering)semantic textual similarity, text similarity, Anlamsal Benzerlik Analizi
קשורות44
תקצירDocument clustering is an unsupervised text-mining task that groups documents with similar content together without using any labels. It is used to organise large collections and for exploratory analysis, drawing on the body of text-mining techniques consolidated by Aggarwal and Zhai (2012) and compared empirically by Steinbach, Karypis and Kumar (2000).Semantic similarity analysis measures how close in meaning two texts are, rather than how many words they share on the surface. Building on the Sentence-BERT work of Reimers and Gurevych (2019), it represents each text as a vector and compares those vectors so that paraphrases score high even when their wording differs.
ScholarGateמערך נתונים
  1. v1
  2. 2 מקורות
  3. PUBLISHED
  1. v1
  2. 2 מקורות
  3. PUBLISHED

מעבר לחיפוש הורדת מצגת

ScholarGateהשוואת שיטות: Document Clustering · Semantic Similarity. אוחזר בתאריך 2026-06-19 מתוך https://scholargate.app/he/compare