Process / pipelineCorpus linguistics

N-gram Analysis

N-gram analysis is a corpus-linguistic technique that extracts and ranks every contiguous sequence of n words (or characters) in a corpus, exposing the recurrent multi-word units — two-word bigrams, three-word trigrams, and longer 'lexical bundles' — that make up a register or text type. By counting how often each sequence recurs, it reveals the prefabricated, formulaic backbone of language that single-word frequency lists cannot capture.

Открыть в MethodMindСкороПрименить, сравнить, получить рекомендации

Инструменты и ресурсы

Скачать слайды

Изучать и исследовать

ВидеоСкоро

Читать метод полностью

Только для участников

Войдите с бесплатным аккаунтом, чтобы прочитать этот раздел.

Войти

Карта метода

Окружение родственных методов — выберите узел, чтобы перейти к нему.

N-gram Analysis

Коллокационный анализ Corpus Concordance Analy…Keyness Analysis Multidimensional Registe…Collostructional Analysis Keyword-in-Context (KWIC…Measure of Textual Lexic…Part-of-Speech Tagging Type-Token Ratio vocd-D (D Measure)

Источники

Biber, D., Johansson, S., Leech, G., Conrad, S., & Finegan, E. (1999). Longman Grammar of Spoken and Written English. Longman. ISBN: 9780582237254
O'Keeffe, A., & McCarthy, M. (Eds.). (2010). The Routledge Handbook of Corpus Linguistics. Routledge. ISBN: 9780415464895
Anthony, L. (2004). AntConc: A learner and classroom friendly, multi-platform corpus analysis toolkit. In Proceedings of IWLeL 2004: An Interactive Workshop on Language e-Learning (pp. 7–13). Waseda University. link ↗

Как цитировать эту страницу

ScholarGate. (2026, June 22). N-gram Frequency Analysis in Corpus Linguistics. ScholarGate. https://scholargate.app/ru/linguistics/n-gram-analysis

Какой метод?

Поставьте этот метод рядом с ближайшими родственными и прочитайте их бок о бок — библиотека выкладывает книги на стол, а выбор за вами.

Коллокационный анализИнтеллектуальный анализ текста↔ сравнить
Corpus Concordance AnalysisЛингвистика↔ сравнить
Keyness AnalysisЛингвистика↔ сравнить
Multidimensional Register AnalysisЛингвистика↔ сравнить

Сравнить рядом →

Упоминается в

Collostructional Analysis Keyword-in-Context (KWIC) Analysis Measure of Textual Lexical Diversity (MTLD)Multidimensional Register Analysis Part-of-Speech Tagging Type-Token Ratio vocd-D (D Measure)

Связанные справочные понятия

Корпусная лингвистика и веб-корпусы Языковое моделирование Стилометрия и атрибуция авторства Анализ дискурса Вычислительная лингвистика Обработка естественного языка

Нашли ошибку на этой странице? Сообщите о ней или предложите исправление →