Process / pipelineCorpus linguistics

N-gram Analysis

N-gram analysis is a corpus-linguistic technique that extracts and ranks every contiguous sequence of n words (or characters) in a corpus, exposing the recurrent multi-word units — two-word bigrams, three-word trigrams, and longer 'lexical bundles' — that make up a register or text type. By counting how often each sequence recurs, it reveals the prefabricated, formulaic backbone of language that single-word frequency lists cannot capture.

Ouvrir dans MethodMindBientôtAppliquer, comparer, obtenir des conseils

Outils et ressources

Télécharger les diapositives

Apprendre et explorer

VidéoBientôt

Lire la méthode complète

Réservé aux membres

Connectez-vous avec un compte gratuit pour lire cette section.

Se connecter

Carte des méthodes

Le voisinage des méthodes apparentées — sélectionnez un nœud pour explorer.

N-gram Analysis

Analyse de collocations Corpus Concordance Analy…Keyness Analysis Multidimensional Registe…Collostructional Analysis Keyword-in-Context (KWIC…Measure of Textual Lexic…Part-of-Speech Tagging Type-Token Ratio vocd-D (D Measure)

Sources

Biber, D., Johansson, S., Leech, G., Conrad, S., & Finegan, E. (1999). Longman Grammar of Spoken and Written English. Longman. ISBN: 9780582237254
O'Keeffe, A., & McCarthy, M. (Eds.). (2010). The Routledge Handbook of Corpus Linguistics. Routledge. ISBN: 9780415464895
Anthony, L. (2004). AntConc: A learner and classroom friendly, multi-platform corpus analysis toolkit. In Proceedings of IWLeL 2004: An Interactive Workshop on Language e-Learning (pp. 7–13). Waseda University. link ↗

Comment citer cette page

ScholarGate. (2026, June 22). N-gram Frequency Analysis in Corpus Linguistics. ScholarGate. https://scholargate.app/fr/linguistics/n-gram-analysis

Quelle méthode ?

Placez cette méthode aux côtés de ses plus proches parentes et lisez-les côte à côte — la bibliothèque pose les ouvrages sur la table ; le choix vous revient.

Analyse de collocationsFouille de textes↔ comparer
Corpus Concordance AnalysisLinguistique↔ comparer
Keyness AnalysisLinguistique↔ comparer
Multidimensional Register AnalysisLinguistique↔ comparer

Comparer côte à côte →

Référencée par

Collostructional Analysis Keyword-in-Context (KWIC) Analysis Measure of Textual Lexical Diversity (MTLD)Multidimensional Register Analysis Part-of-Speech Tagging Type-Token Ratio vocd-D (D Measure)

Méthodes similaires

N-gram Language Model Text Frequency Analysis Corpus Linguistics Collocation Analysis Corpus Concordance Analysis Collostructional Analysis Multidimensional Register Analysis Co-occurrence Analysis

Concepts de référence associés

Linguistique de corpus et corpus web Modélisation du langage Stylométrie et attribution d'auteur Analyse du discours Linguistique computationnelle Traitement Automatique du Langage Naturel

Une erreur sur cette page ? Signalez-la ou proposez une correction →