Process / pipeline
Mô hình ngôn ngữ N-gram
Mô hình ngôn ngữ N-gram là một mô hình thống kê dự đoán xác suất của từ tiếp theo chỉ bằng cách xem xét n−1 từ trước đó. Được Jurafsky và Martin mô tả chi tiết (trong Speech and Language Processing), nó cung cấp cơ sở hạ tầng nền tảng cho việc sinh văn bản, sửa lỗi chính tả và nhận dạng giọng nói.
Đọc toàn bộ phương pháp
Chỉ dành cho thành viên
Đăng nhậpĐăng nhập bằng tài khoản miễn phí để đọc phần này.
Method map
The neighbourhood of related methods — select a node to explore.
Nguồn tài liệu
- Jurafsky, D. & Martin, J.H. (2023). Speech and Language Processing, 3rd ed. link ↗
- Chen, S.F. & Goodman, J. (1999). An Empirical Study of Smoothing Techniques for Language Modeling. Computer Speech & Language, 13(4), 359-394. DOI: 10.1006/csla.1999.0128 ↗
Cách trích dẫn trang này
ScholarGate. (2026, June 1). N-gram Statistical Language Model. ScholarGate. https://scholargate.app/vi/text-mining/ngram-language-model
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Phân loại văn bảnKhai phá văn bản↔ compare
- Hồi quy văn bảnKhai phá văn bản↔ compare
- TF-IDFKhai phá văn bản↔ compare
- Nhận dạng nghĩa của từ (Word Sense Disambiguation - WSD)Khai phá văn bản↔ compare
Được tham chiếu bởi
Phát hiện lỗi trên trang này? Báo cáo hoặc đề xuất chỉnh sửa →