BERTopic — Neuronové modelovanie tém
BERTopic je neuronový pipeline na modelovanie tém, ktorý predstavil Maarten Grootendorst v roku 2022. Kombinuje kontextové vkladané reprezentácie (embeddings) založené na BERT s redukciou dimenzionality pomocou UMAP a zhlukovaním pomocou HDBSCAN, aby vytvoril koherentné, dynamické témy, čím dosahuje vyššiu koherenciu tém ako klasické modely tém.
Prečítať celú metódu
Ak si chcete prečítať túto sekciu, prihláste sa s bezplatným účtom.
Method map
The neighbourhood of related methods — select a node to explore.
Zdroje
- Grootendorst, M. (2022). BERTopic: Neural topic modeling with a class-based TF-IDF procedure. arXiv:2203.05794. DOI: 10.48550/arXiv.2203.05794 ↗
- McInnes, L., Healy, J. & Astels, S. (2017). hdbscan: Hierarchical density based clustering. Journal of Open Source Software, 2(11), 205. DOI: 10.21105/joss.00205 ↗
Ako citovať túto stránku
ScholarGate. (2026, June 1). BERTopic — Neural Topic Modeling. ScholarGate. https://scholargate.app/sk/text-mining/topic-modeling-bertopic
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Vložené reprezentácie BERTDolovanie textu↔ compare
- Zoskupovanie dokumentovDolovanie textu↔ compare
- Analýza sentimentuDolovanie textu↔ compare
Odkazujú sem
Našli ste na tejto stránke chybu? Nahláste ju alebo navrhnite opravu →