ScholarGate
Assistente
Process / pipelineCorpus linguistics

N-gram Analysis

N-gram analysis is a corpus-linguistic technique that extracts and ranks every contiguous sequence of n words (or characters) in a corpus, exposing the recurrent multi-word units — two-word bigrams, three-word trigrams, and longer 'lexical bundles' — that make up a register or text type. By counting how often each sequence recurs, it reveals the prefabricated, formulaic backbone of language that single-word frequency lists cannot capture.

Abrir no MethodMindEm breveAplicar, comparar, obter orientação
Ferramentas e recursos
Baixar slides
Aprender e explorar
VídeoEm breve

Leia o método completo

Exclusivo para membros

Entre com uma conta gratuita para ler esta seção.

Entrar

Mapa de métodos

A vizinhança de métodos relacionados — selecione um nó para explorar.

Fontes

  1. Biber, D., Johansson, S., Leech, G., Conrad, S., & Finegan, E. (1999). Longman Grammar of Spoken and Written English. Longman. ISBN: 9780582237254
  2. O'Keeffe, A., & McCarthy, M. (Eds.). (2010). The Routledge Handbook of Corpus Linguistics. Routledge. ISBN: 9780415464895
  3. Anthony, L. (2004). AntConc: A learner and classroom friendly, multi-platform corpus analysis toolkit. In Proceedings of IWLeL 2004: An Interactive Workshop on Language e-Learning (pp. 7–13). Waseda University. link

Como citar esta página

ScholarGate. (2026, June 22). N-gram Frequency Analysis in Corpus Linguistics. ScholarGate. https://scholargate.app/pt/linguistics/n-gram-analysis

Qual método?

Coloque este método ao lado dos seus pares mais próximos e leia-os lado a lado — a biblioteca dispõe os livros sobre a mesa; a escolha é sua.

Comparar lado a lado

Referenciado por

ScholarGateN-gram Analysis (N-gram Frequency Analysis in Corpus Linguistics). Recuperado em 2026-06-24 de https://scholargate.app/pt/linguistics/n-gram-analysis · Conjunto de dados: https://doi.org/10.5281/zenodo.20539026