Process / pipelineCorpus linguistics

N-gram Analysis

N-gram analysis is a corpus-linguistic technique that extracts and ranks every contiguous sequence of n words (or characters) in a corpus, exposing the recurrent multi-word units — two-word bigrams, three-word trigrams, and longer 'lexical bundles' — that make up a register or text type. By counting how often each sequence recurs, it reveals the prefabricated, formulaic backbone of language that single-word frequency lists cannot capture.

Buka dalam MethodMindTidak lama lagiGuna, banding, dapatkan panduan

Alat & sumber

Muat turun slaid

Pelajari & terokai

VideoTidak lama lagi

Baca kaedah sepenuhnya

Ahli sahaja

Log masuk dengan akaun percuma untuk membaca bahagian ini.

Log masuk

Peta kaedah

Kejiranan kaedah berkaitan — pilih satu nod untuk meneroka.

N-gram Analysis

Analisis Kolokasi Corpus Concordance Analy…Keyness Analysis Multidimensional Registe…Collostructional Analysis Keyword-in-Context (KWIC…Measure of Textual Lexic…Part-of-Speech Tagging Type-Token Ratio vocd-D (D Measure)

Sumber

Biber, D., Johansson, S., Leech, G., Conrad, S., & Finegan, E. (1999). Longman Grammar of Spoken and Written English. Longman. ISBN: 9780582237254
O'Keeffe, A., & McCarthy, M. (Eds.). (2010). The Routledge Handbook of Corpus Linguistics. Routledge. ISBN: 9780415464895
Anthony, L. (2004). AntConc: A learner and classroom friendly, multi-platform corpus analysis toolkit. In Proceedings of IWLeL 2004: An Interactive Workshop on Language e-Learning (pp. 7–13). Waseda University. link ↗

Cara memetik halaman ini

ScholarGate. (2026, June 22). N-gram Frequency Analysis in Corpus Linguistics. ScholarGate. https://scholargate.app/ms/linguistics/n-gram-analysis

Kaedah yang mana?

Letakkan kaedah ini di sebelah kaedah yang paling rapat dengannya dan baca secara bersebelahan — perpustakaan menyusun buku di atas meja; pilihan terletak pada anda.

Analisis KolokasiPerlombongan Teks↔ banding
Corpus Concordance AnalysisLinguistik↔ banding
Keyness AnalysisLinguistik↔ banding
Multidimensional Register AnalysisLinguistik↔ banding

Bandingkan secara bersebelahan →

Dirujuk oleh

Collostructional Analysis Keyword-in-Context (KWIC) Analysis Measure of Textual Lexical Diversity (MTLD)Multidimensional Register Analysis Part-of-Speech Tagging Type-Token Ratio vocd-D (D Measure)

Kaedah serupa

N-gram Language Model Text Frequency Analysis Corpus Linguistics Collocation Analysis Corpus Concordance Analysis Collostructional Analysis Multidimensional Register Analysis Co-occurrence Analysis

Konsep rujukan berkaitan

Linguistik Korpus dan Korpora Web Pemodelan Bahasa Stilometri dan Atribusi Pengarang Analisis Wacana Linguistik Komputasi Pemprosesan Bahasa Asli

Terjumpa masalah pada halaman ini? Laporkan atau cadangkan pembetulan →