Process / pipeline

Modelování témat pomocí NMF

Modelování témat pomocí NMF využívá nedochovanou maticovou faktorizaci (Non-negative Matrix Factorization) – dekompozici založenou na částech, kterou zavedli Lee a Seung (1999) – k extrakci distribucí dokument-téma z korpusu. Faktorizací matice dokumentů a slov na dvě nedochované matice obnovuje malý soubor témat a má tendenci produkovat interpretovatelnější témata než LDA.

Otevřít v MethodMindJiž brzyVideoJiž brzyDownload slides

Přečíst celou metodu

Pouze pro členy

Pro přečtení této sekce se přihlaste s bezplatným účtem.

Přihlásit se

Method map

The neighbourhood of related methods — select a node to explore.

Modelování témat pomocí NMF

BERT Embeddings BERTopic Shlukování dokumentů TF-IDF Extrakce klíčových slov

Zdroje

Lee, D.D. & Seung, H.S. (1999). Learning the Parts of Objects by Non-negative Matrix Factorization. Nature, 401, 788-791. DOI: 10.1038/44565 ↗
Arora, S., Ge, R., Halpern, Y., Mimno, D., Moitra, A., Sontag, D., Wu, Y. & Zhu, M. (2013). A Practical Algorithm for Topic Modeling with Provable Guarantees. Proceedings of the 30th International Conference on Machine Learning (ICML), 280-288. link ↗

Jak citovat tuto stránku

ScholarGate. (2026, June 1). Topic Modeling with Non-negative Matrix Factorization. ScholarGate. https://scholargate.app/cs/text-mining/topic-modeling-nmf

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

BERT EmbeddingsDolování textu↔ compare
BERTopicDolování textu↔ compare
Shlukování dokumentůDolování textu↔ compare
TF-IDFDolování textu↔ compare

Compare side by side →

Odkazuje sem

Extrakce klíčových slov

Našli jste na této stránce chybu? Nahlaste ji nebo navrhněte opravu →