ScholarGate
Avustaja
Process / pipelineCorpus linguistics

N-gram Analysis

N-gram analysis is a corpus-linguistic technique that extracts and ranks every contiguous sequence of n words (or characters) in a corpus, exposing the recurrent multi-word units — two-word bigrams, three-word trigrams, and longer 'lexical bundles' — that make up a register or text type. By counting how often each sequence recurs, it reveals the prefabricated, formulaic backbone of language that single-word frequency lists cannot capture.

Avaa sovelluksessa MethodMindTulossaSovella, vertaa, saa ohjeita
Työkalut ja resurssit
Lataa diat
Opi ja tutki
VideoTulossa

Lue koko menetelmä

Vain jäsenille

Kirjaudu sisään maksuttomalla tilillä lukeaksesi tämän osion.

Kirjaudu sisään

Menetelmäkartta

Lähimenetelmien naapurusto — valitse solmu tutkiaksesi.

Lähteet

  1. Biber, D., Johansson, S., Leech, G., Conrad, S., & Finegan, E. (1999). Longman Grammar of Spoken and Written English. Longman. ISBN: 9780582237254
  2. O'Keeffe, A., & McCarthy, M. (Eds.). (2010). The Routledge Handbook of Corpus Linguistics. Routledge. ISBN: 9780415464895
  3. Anthony, L. (2004). AntConc: A learner and classroom friendly, multi-platform corpus analysis toolkit. In Proceedings of IWLeL 2004: An Interactive Workshop on Language e-Learning (pp. 7–13). Waseda University. link

Näin viittaat tähän sivuun

ScholarGate. (2026, June 22). N-gram Frequency Analysis in Corpus Linguistics. ScholarGate. https://scholargate.app/fi/linguistics/n-gram-analysis

Mikä menetelmä?

Aseta tämä menetelmä lähimpien sukulaistensa rinnalle ja lue niitä yhdessä — kirjasto asettaa teokset pöydälle; valinta on sinun.

Vertaa rinnakkain

Tähän viittaavat

ScholarGateN-gram Analysis (N-gram Frequency Analysis in Corpus Linguistics). Haettu 2026-06-24 osoitteesta https://scholargate.app/fi/linguistics/n-gram-analysis · Aineisto: https://doi.org/10.5281/zenodo.20539026