Представление и предобработка текста
135 — методы этого семейства.
Избранное
Разрешение аббревиатурAbbreviation and acronym resolution is a natural-language-processing pipeline that maps each short form in a text to its full-length definition using contextual cues from the surroАкустическая фонетикаAcoustic Phonetics is the study of the physical properties of speech sounds using instrumentation to measure and analyze sound waves. Pioneered by Peter Ladefoged and Kenneth SteveИзвлечение аргументацииArgument mining is a natural-language-processing task that automatically detects claims, premises and the argumentative structures that link them within text. Consolidated as a fieАудио-отпечаткиAudio fingerprinting is a technique for creating a compact, robust identifier (fingerprint) for audio recordings that uniquely represents the content while being tolerant to modifiАтрибуция авторства (стилометрия)Authorship attribution is the task of identifying the most probable author of an anonymous or disputed text by analysing its stylistic fingerprint. Rooted in the statistical work oАвтоматизированная оценка эссе (AES)Automated Essay Scoring (AES) is a natural-language-processing task in which a computational model assigns scores to student-written essays across dimensions such as grammatical co
Reading path
This topic's most-referenced foundational methods, in the order they were developed — a place to start if you're new here.
Все методы 135
Разрешение аббревиатурАкустическая фонетикаИзвлечение аргументацииАудио-отпечаткиАтрибуция авторства (стилометрия)Автоматизированная оценка эссе (AES)Автоматическая транскрипция музыкиОтслеживание тактовДообучение BERTКлассификация на основе BERTРаспознавание аккордовChronosClinical Text MiningCLIPАнализ совместной встречаемостиКоллокационный анализЗдравый смысл в обработке естественного языка (NLP)Сравнительный методРазрешение кореференцииКорпусная лингвистикаОтслеживание сущностей между документамиКросс-языковой анализ текстовДиалектометрияПрямая оптимизация предпочтенийКластеризация документовАдаптация доменаАдаптация BERT-модели к домену на основе классификацииАдаптация к домену для распознавания именованных сущностейАдаптация RoBERTa на основе домена для классификацииАдаптация к домену при анализе тональностиDomain-adaptive Word2VecЭлектропалатографияВыявление событийОбъяснимое распознавание именованных сущностейОбъяснимый анализ тональностиFastTextДообученная классификация на основе BERTДообученное распознавание именованных сущностейДообученное вопросно-ответное извлечениеКлассификация на основе дообученной модели RoBERTaТонкая настройка эмбеддингов предложенийFine-Tuned Word2VecГлоттохронологияТонкая настройка GPTGraphRAGОбнаружение галлюцинацийГармонический анализ в музыкеДетекция языка враждыПреобразование Гильберта-ХуангаОснованная на признаках структура фразы (HPSG)Извлечение информацииРаспознавание инструментовВнутренняя реконструкцияИзвлечение ключевых словПостроение графа знаний из текстаИдентификация языка (LID)Лексическое разнообразиеЛексическая подстановкаОценка лингвистической приемлемостиЛингвистическая этнографияИзвлечение мелодииМинималистская программаМорфологический анализМногоязычная классификация на основе RoBERTaМногоязычный анализ тональностиМультиязычный трансформерМультимодальная классификация на основе BERTМультимодальный дискурс-анализМультимодальное распознавание именованных сущностейМультимодальная классификация на основе RoBERTaМультимодальный Word2VecКлассификация музыкальных жанровСегментация музыкиМера музыкального сходстваОпределение тональности музыкиАнализ N400/P600Генерация естественного языкаОбнаружение отрицанияИзвлечение открытой информацииТеория оптимальностиЗадача Ламберта (Определение орбиты)Обнаружение парафразАлгоритм определения высоты тонаШкала политической толерантностиОбнаружение пропагандыТеория прототиповПсихолингвистическое отслеживание взглядаQLoRAАнализ удобочитаемостиИзвлечение отношенийГенерация с дополненной выборкой (Retrieval-Augmented Generation, RAG)Классификация на основе RoBERTaНаучный текстовый майнингКлассификация на основе самообуча с использованием BERTСамообучающееся распознавание именованных сущностейКлассификация на основе самообучения с использованием RoBERTaСамостоятельно обучаемый анализ тональностиСамообучающийся Word2VecСемантический анализ признаковСемантическое сходствоПолуавтоматическая классификация на основе BERTКлассификация на основе RoBERTa с частичной разметкойПолуавтоматический анализ тональностиПолуавтообучаемый Word2VecВекторные представления предложенийЗаполнение слотовАнализ сетей типа «малый мир» и безмасштабных сетейОбработка естественного языка (NLP) в социальных сетяхДетекция спекуляцийТеория речевых актовПроверка орфографии и грамматикиСистемная функциональная лингвистикаОценка темпаОценка связности текстаАнализ сложности текстаДедупликация текстовАнализ частоты текстаТекстовый сетевой анализНормализация текстаРегрессия на текстеСегментация текстаОбусловленность текстаTF-IDFАнализ тембраTimeGPTИзвлечение временной шкалыТрансферное обучение с классификацией на основе BERTТрансферное обучение для распознавания именованных сущностейTransfer Learning with Sentence EmbeddingsTransformer (NLP)Разделение вокалаКлассификация на основе BERT при слабом обученииСлабо контролируемая классификация на основе RoBERTaСлабо контролируемый Word2VecШкала ксенофобии