Reprezentacja i wstępne przetwarzanie tekstu
135 — metody w tej rodzinie.
Wyróżnione
Rozwijanie skrótówAbbreviation and acronym resolution is a natural-language-processing pipeline that maps each short form in a text to its full-length definition using contextual cues from the surroFonetyka akustycznaAcoustic Phonetics is the study of the physical properties of speech sounds using instrumentation to measure and analyze sound waves. Pioneered by Peter Ladefoged and Kenneth SteveGórnictwo argumentówArgument mining is a natural-language-processing task that automatically detects claims, premises and the argumentative structures that link them within text. Consolidated as a fieOdczyt cech akustycznychAudio fingerprinting is a technique for creating a compact, robust identifier (fingerprint) for audio recordings that uniquely represents the content while being tolerant to modifiAtrybucja autorstwa (stylometria)Authorship attribution is the task of identifying the most probable author of an anonymous or disputed text by analysing its stylistic fingerprint. Rooted in the statistical work oAutomated Essay Scoring (AES)Automated Essay Scoring (AES) is a natural-language-processing task in which a computational model assigns scores to student-written essays across dimensions such as grammatical co
Reading path
This topic's most-referenced foundational methods, in the order they were developed — a place to start if you're new here.
Wszystkie metody 135
Rozwijanie skrótówFonetyka akustycznaGórnictwo argumentówOdczyt cech akustycznychAtrybucja autorstwa (stylometria)Automated Essay Scoring (AES)Automatyczna transkrypcja muzykiŚledzenie rytmuDostrajanie BERTKlasyfikacja oparta na BERTRozpoznawanie akordówChronos: Tokenizowany model podstawowy do prognozowania szeregów czasowychEksploracja Tekstu KlinicznegoCLIPAnaliza współwystępowaniaAnaliza kolokacjiRozumowanie oparte na zdrowym rozsądku w NLPMetoda porównawczaRozstrzyganie współwystępowaniaLingwistyka korealnaŚledzenie bytów między dokumentamiAnaliza tekstów międzyjęzykowychDialektometriaOptymalizacja Bezpośrednich PreferencjiGrupowanie dokumentówAdaptacja domenowaKlasyfikacja oparta na domenowo adaptowanym modelu BERTNazewnictwo jednostek nazwanych z adaptacją do domenyAdaptacyjna do domeny klasyfikacja oparta na RoBERTaAdaptacja domenowa analizy sentymentuDomain-adaptive Word2VecElektropalatografiaDetekcja zdarzeńWyjaśnialne rozpoznawanie jednostek nazwanychWyjaśnialna analiza sentymentuFastTextKlasyfikacja oparta na dostrojonym modelu BERTDostrajanie rozpoznawania jednostek nazewniczychDostrajanie odpowiedzi na pytaniaKlasyfikacja oparta na dostrojonym modelu RoBERTaDostrojone osadzenia zdańFine-Tuned Word2VecGlottochronologiaDostrajanie GPTGraphRAGWykrywanie halucynacjiAnaliza harmoniczna w muzyceWykrywanie mowy nienawiściTransformata Hilberta-HuangaHPSGEkstrakcja informacjiRozpoznawanie instrumentówRekonstrukcja wewnętrznaEkstrakcja słów kluczowychKonstrukcja grafu wiedzy z tekstuIdentyfikacja języka (LID)Różnorodność leksykalnaPodstawienie leksykalneOcena akceptowalności językowejEtnografia LingwistycznaEkstrakcja melodiiProgram minimalistycznyAnaliza morfologicznaKlasyfikacja oparta na wielojęzycznym modelu RoBERTaWielojęzyczna analiza sentymentuWielojęzyczny transformatorKlasyfikacja multimodalna oparta na BERTAnaliza dyskursu multimodalnegoWielomodalne rozpoznawanie nazw własnychKlasyfikacja multimodalna oparta na modelu RoBERTaMultimodal Word2VecKlasyfikacja gatunku muzycznegoSegmentacja muzykiMiara podobieństwa muzycznegoDetekcja tonacji muzycznejAnaliza N400/P600Generowanie Języka NaturalnegoDetekcja negacjiOtwarta Ekstrakcja InformacjiTeoria optymalnościWyznaczanie orbity (Problem Lamberta)Wykrywanie parafrazyAlgorytm detekcji wysokości dźwiękuSkala Tolerancji PolitycznejDetekcja propagandyTeoria prototypówPsycholingwistyczne śledzenie wzrokuQLoRAAnaliza czytelnościEkstrakcja relacjiRetrieval-Augmented Generation (RAG) (Generowanie Wzbogacone o Wyszukiwanie)Klasyfikacja oparta na RoBERTaGórnictwo tekstów naukowychKlasyfikacja oparta na samo-nadzorowanym modelu BERTSamouczeniowa ekstrakcja jednostek nazwanych (NER)Klasyfikacja oparta na samo-nadzorowanym modelu RoBERTaSamonadzorowana analiza sentymentuWord2Vec z samonadzoremAnaliza cech semantycznychPodobieństwo semantyczneKlasyfikacja półnadzorowana oparta na BERTKlasyfikacja oparta na półnadzorczym modelu RoBERTaPółnadzorowana analiza sentymentuWord2Vec w uczeniu częściowo nadzorowanym (Semi-supervised Word2Vec)Osadzanie zdańWypełnianie slotówAnaliza sieci małych światów i sieci bezskalowychSocial Media NLPWykrywanie spekulacjiTeoria aktów mowyKorekta pisowni i gramatykiLingwistyka systemowo-funkcjonalnaEstymacja tempaPunktacja spójności tekstuAnaliza złożoności tekstuDeduplikacja tekstuAnaliza częstości występowania tekstuAnaliza sieciowa tekstuNormalizacja tekstuRegresja tekstowaSegmentacja tekstuEntailment tekstualneTF-IDFAnaliza barwy dźwiękuTimeGPTEkstrakcja osi czasuUczenie maszynowe z klasyfikacją opartą na BERTUczenie transferowe w rozpoznawaniu nazwanych encjiUczenie transferowe z osadzaniem zdańTransformer (NLP)Separacja wokalnaKlasyfikacja BERT oparta na słabym nadzorzeKlasyfikacja z użyciem RoBERTa z nadzorem słabymWeakly Supervised Word2VecSkala ksenofobii