ScholarGate
Assistent
Process / pipeline

Sprachidentifikation (LID)

Sprachidentifikation ist eine Aufgabe der natürlichen Sprachverarbeitung, die automatisch erkennt, in welcher Sprache ein Text verfasst ist. Aufbauend auf sofort einsetzbaren Tools wie langid.py (Lui & Baldwin, 2012) und den effizienten Klassifikatoren von Joulin et al. (2017) wird sie häufig zur Vorverarbeitung und Filterung mehrsprachiger Datensätze eingesetzt.

In MethodMind öffnenDemnächstVideoDemnächstDownload slides

Die vollständige Methode lesen

Nur für Mitglieder

Melden Sie sich mit einem kostenlosen Konto an, um diesen Abschnitt zu lesen.

Anmelden

Method map

The neighbourhood of related methods — select a node to explore.

Quellen

  1. Lui, M. & Baldwin, T. (2012). langid.py: An Off-the-shelf Language Identification Tool. Proceedings of the ACL 2012 System Demonstrations. link
  2. Joulin, A., Grave, E., Bojanowski, P. & Mikolov, T. (2017). Bag of Tricks for Efficient Text Classification. Proceedings of the EACL 2017. link

So zitieren Sie diese Seite

ScholarGate. (2026, June 1). Language Identification (LID). ScholarGate. https://scholargate.app/de/text-mining/language-identification

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Referenziert von

ScholarGateLanguage Identification (Language Identification (LID)). Abgerufen am 2026-06-15 von https://scholargate.app/de/text-mining/language-identification · Datensatz: https://doi.org/10.5281/zenodo.20539026