Social Media NLP — Tekstanalyse for korte og støjfyldte tekster
Social Media NLP er en specialiseret pipeline til naturlig sprogbehandling (NLP), designet til den korte, støjfyldte og uformelle tekst, der findes på platforme som Twitter, Reddit og i kommentarfeltet. I modsætning til generel NLP tager denne pipeline højde for platformsspecifikke konventioner – hashtags, emojis, forkortelser og sprogskifte – hvilket muliggør opgaver som hashtag-analyse, detektion af viralt indhold og måling af den offentlige mening. Den etablerede tradition for denne tilgang blev grundlagt gennem SemEval-2017 Task 4 (Rosenthal et al., 2017) og det forenede benchmark TweetEval (Barbieri et al., 2020).
Læs hele metoden
Log ind med en gratis konto for at læse dette afsnit.
Metodekort
Nabolaget af beslægtede metoder — vælg en knude for at udforske.
Kilder
- Rosenthal, S. et al. (2017). SemEval-2017 Task 4: Sentiment Analysis in Twitter. Proceedings of the 11th International Workshop on Semantic Evaluation (SemEval-2017). ACL. link ↗
- Barbieri, F. et al. (2020). TweetEval: Unified Benchmark and Comparative Evaluation for Tweet Classification. Findings of the Association for Computational Linguistics: EMNLP 2020. link ↗
Sådan citerer du denne side
ScholarGate. (2026, June 1). Social Media Text Analysis (NLP Pipeline). ScholarGate. https://scholargate.app/da/text-mining/social-media-nlp
Hvilken metode?
Stil denne metode ved siden af dens nærmeste slægtninge, og læs dem side om side — biblioteket lægger bøgerne på bordet; valget er dit.
- BERT-indlejringerTekstmining↔ sammenlign
- SentimentanalyseTekstmining↔ sammenlign
- TekstklassificeringTekstmining↔ sammenlign
- TF-IDFTekstmining↔ sammenlign
- Emne-modelleringDyb læring↔ sammenlign
Har du fundet en fejl på denne side? Indberet den eller foreslå en rettelse →