Modelování témat pomocí NMF
Modelování témat pomocí NMF využívá nedochovanou maticovou faktorizaci (Non-negative Matrix Factorization) – dekompozici založenou na částech, kterou zavedli Lee a Seung (1999) – k extrakci distribucí dokument-téma z korpusu. Faktorizací matice dokumentů a slov na dvě nedochované matice obnovuje malý soubor témat a má tendenci produkovat interpretovatelnější témata než LDA.
Přečíst celou metodu
Pro přečtení této sekce se přihlaste s bezplatným účtem.
Method map
The neighbourhood of related methods — select a node to explore.
Zdroje
- Lee, D.D. & Seung, H.S. (1999). Learning the Parts of Objects by Non-negative Matrix Factorization. Nature, 401, 788-791. DOI: 10.1038/44565 ↗
- Arora, S., Ge, R., Halpern, Y., Mimno, D., Moitra, A., Sontag, D., Wu, Y. & Zhu, M. (2013). A Practical Algorithm for Topic Modeling with Provable Guarantees. Proceedings of the 30th International Conference on Machine Learning (ICML), 280-288. link ↗
Jak citovat tuto stránku
ScholarGate. (2026, June 1). Topic Modeling with Non-negative Matrix Factorization. ScholarGate. https://scholargate.app/cs/text-mining/topic-modeling-nmf
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- BERT EmbeddingsDolování textu↔ compare
- BERTopicDolování textu↔ compare
- Shlukování dokumentůDolování textu↔ compare
- TF-IDFDolování textu↔ compare
Odkazuje sem
Našli jste na této stránce chybu? Nahlaste ji nebo navrhněte opravu →