N-gram Analysis
N-gram analysis is a corpus-linguistic technique that extracts and ranks every contiguous sequence of n words (or characters) in a corpus, exposing the recurrent multi-word units — two-word bigrams, three-word trigrams, and longer 'lexical bundles' — that make up a register or text type. By counting how often each sequence recurs, it reveals the prefabricated, formulaic backbone of language that single-word frequency lists cannot capture.
Đọc toàn bộ phương pháp
Đăng nhập bằng tài khoản miễn phí để đọc phần này.
Bản đồ phương pháp
Lân cận của các phương pháp liên quan — chọn một nút để khám phá.
Nguồn tài liệu
- Biber, D., Johansson, S., Leech, G., Conrad, S., & Finegan, E. (1999). Longman Grammar of Spoken and Written English. Longman. ISBN: 9780582237254
- O'Keeffe, A., & McCarthy, M. (Eds.). (2010). The Routledge Handbook of Corpus Linguistics. Routledge. ISBN: 9780415464895
- Anthony, L. (2004). AntConc: A learner and classroom friendly, multi-platform corpus analysis toolkit. In Proceedings of IWLeL 2004: An Interactive Workshop on Language e-Learning (pp. 7–13). Waseda University. link ↗
Cách trích dẫn trang này
ScholarGate. (2026, June 22). N-gram Frequency Analysis in Corpus Linguistics. ScholarGate. https://scholargate.app/vi/linguistics/n-gram-analysis
Phương pháp nào?
Đặt phương pháp này bên cạnh những phương pháp gần gũi nhất với nó và đọc chúng song song — thư viện bày sách lên bàn; lựa chọn là của bạn.
- Phân tích từ ngữ cố địnhKhai phá văn bản↔ so sánh
- Corpus Concordance AnalysisNgôn ngữ học↔ so sánh
- Keyness AnalysisNgôn ngữ học↔ so sánh
- Multidimensional Register AnalysisNgôn ngữ học↔ so sánh
Được tham chiếu bởi
Phương pháp tương tự
Phát hiện lỗi trên trang này? Báo cáo hoặc đề xuất chỉnh sửa →