BERTopic — neuronové modelování témat
BERTopic je neuronová pipeline pro modelování témat, kterou představil Maarten Grootendorst v roce 2022. Kombinuje kontextová vnoření založená na BERT s redukcí dimenzionality UMAP a shlukováním HDBSCAN, aby vytvořila koherentní, dynamická témata, čímž dosahuje vyšší koherence témat než klasické modely témat.
Přečíst celou metodu
Pro přečtení této sekce se přihlaste s bezplatným účtem.
Method map
The neighbourhood of related methods — select a node to explore.
Zdroje
- Grootendorst, M. (2022). BERTopic: Neural topic modeling with a class-based TF-IDF procedure. arXiv:2203.05794. DOI: 10.48550/arXiv.2203.05794 ↗
- McInnes, L., Healy, J. & Astels, S. (2017). hdbscan: Hierarchical density based clustering. Journal of Open Source Software, 2(11), 205. DOI: 10.21105/joss.00205 ↗
Jak citovat tuto stránku
ScholarGate. (2026, June 1). BERTopic — Neural Topic Modeling. ScholarGate. https://scholargate.app/cs/text-mining/topic-modeling-bertopic
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- BERT EmbeddingsDolování textu↔ compare
- Shlukování dokumentůDolování textu↔ compare
- Analýza sentimentuDolování textu↔ compare
Odkazuje sem
Našli jste na této stránce chybu? Nahlaste ji nebo navrhněte opravu →