Process / pipeline

Mô hình ngôn ngữ N-gram

Mô hình ngôn ngữ N-gram là một mô hình thống kê dự đoán xác suất của từ tiếp theo chỉ bằng cách xem xét n−1 từ trước đó. Được Jurafsky và Martin mô tả chi tiết (trong Speech and Language Processing), nó cung cấp cơ sở hạ tầng nền tảng cho việc sinh văn bản, sửa lỗi chính tả và nhận dạng giọng nói.

Mở trong MethodMindSắp ra mắtVideoSắp ra mắtDownload slides

Đọc toàn bộ phương pháp

Chỉ dành cho thành viên

Đăng nhập bằng tài khoản miễn phí để đọc phần này.

Đăng nhập

Method map

The neighbourhood of related methods — select a node to explore.

Mô hình ngôn ngữ N-gram

Phân loại văn bản Hồi quy văn bản TF-IDF Nhận dạng nghĩa của từ (…Nhận dạng ngôn ngữ (LID)Kiểm tra chính tả và ngữ…Phân đoạn văn bản

Nguồn tài liệu

Jurafsky, D. & Martin, J.H. (2023). Speech and Language Processing, 3rd ed. link ↗
Chen, S.F. & Goodman, J. (1999). An Empirical Study of Smoothing Techniques for Language Modeling. Computer Speech & Language, 13(4), 359-394. DOI: 10.1006/csla.1999.0128 ↗

Cách trích dẫn trang này

ScholarGate. (2026, June 1). N-gram Statistical Language Model. ScholarGate. https://scholargate.app/vi/text-mining/ngram-language-model

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Phân loại văn bảnKhai phá văn bản↔ compare
Hồi quy văn bảnKhai phá văn bản↔ compare
TF-IDFKhai phá văn bản↔ compare
Nhận dạng nghĩa của từ (Word Sense Disambiguation - WSD)Khai phá văn bản↔ compare

Compare side by side →

Được tham chiếu bởi

Nhận dạng ngôn ngữ (LID)Kiểm tra chính tả và ngữ pháp Phân đoạn văn bản

Phát hiện lỗi trên trang này? Báo cáo hoặc đề xuất chỉnh sửa →

Đọc toàn bộ phương pháp

Method map

Nguồn tài liệu

Cách trích dẫn trang này

Phương pháp liên quan

Which method?

Được tham chiếu bởi