N-gram Analysis
N-gram analysis is a corpus-linguistic technique that extracts and ranks every contiguous sequence of n words (or characters) in a corpus, exposing the recurrent multi-word units — two-word bigrams, three-word trigrams, and longer 'lexical bundles' — that make up a register or text type. By counting how often each sequence recurs, it reveals the prefabricated, formulaic backbone of language that single-word frequency lists cannot capture.
อ่านวิธีฉบับเต็ม
เข้าสู่ระบบด้วยบัญชีฟรีเพื่ออ่านส่วนนี้
แผนที่ระเบียบวิธี
ย่านของระเบียบวิธีที่เกี่ยวข้องกัน — เลือกโหนดเพื่อสำรวจ
แหล่งอ้างอิง
- Biber, D., Johansson, S., Leech, G., Conrad, S., & Finegan, E. (1999). Longman Grammar of Spoken and Written English. Longman. ISBN: 9780582237254
- O'Keeffe, A., & McCarthy, M. (Eds.). (2010). The Routledge Handbook of Corpus Linguistics. Routledge. ISBN: 9780415464895
- Anthony, L. (2004). AntConc: A learner and classroom friendly, multi-platform corpus analysis toolkit. In Proceedings of IWLeL 2004: An Interactive Workshop on Language e-Learning (pp. 7–13). Waseda University. link ↗
วิธีอ้างอิงหน้านี้
ScholarGate. (2026, June 22). N-gram Frequency Analysis in Corpus Linguistics. ScholarGate. https://scholargate.app/th/linguistics/n-gram-analysis
ระเบียบวิธีใด?
วางระเบียบวิธีนี้เคียงข้างระเบียบวิธีใกล้เคียงที่สุด แล้วอ่านเปรียบเทียบกัน — คลังวางหนังสือไว้บนโต๊ะให้แล้ว ส่วนการเลือกเป็นของท่าน
- การวิเคราะห์คำคู่การทำเหมืองข้อความ↔ เปรียบเทียบ
- Corpus Concordance Analysisภาษาศาสตร์↔ เปรียบเทียบ
- Keyness Analysisภาษาศาสตร์↔ เปรียบเทียบ
- Multidimensional Register Analysisภาษาศาสตร์↔ เปรียบเทียบ