Machine learningDeep learning / NLP / CV

Samoučící se LDA model témat

Samoučící se LDA kombinuje pravděpodobnostní generativní rámec latentní Dirichletovy alokace (LDA) se signály předtrénování pomocí samoučení — jako je predikce maskovaného slova nebo kontrastní dokumentové cíle — k řízení objevování témat bez nutnosti ručně označených trénovacích dat. Výsledkem jsou reprezentace témat, které jsou současně zakořeněny v distribučních statistikách a obohaceny o jazykovou strukturu naučenou ze surového textu.

Otevřít v MethodMindJiž brzyVideoJiž brzyDownload slides

Přečíst celou metodu

Pouze pro členy

Pro přečtení této sekce se přihlaste s bezplatným účtem.

Přihlásit se

Method map

The neighbourhood of related methods — select a node to explore.

Zdroje

  1. Blei, D. M., Ng, A. Y., & Jordan, M. I. (2003). Latent Dirichlet Allocation. Journal of Machine Learning Research, 3, 993–1022. link
  2. Meng, Y., Huang, J., Zhang, Y., & Han, J. (2022). Topic Discovery via Latent Space Clustering of Pretrained Language Model Representations. Proceedings of WWW 2022, ACM. DOI: 10.1145/3485447.3512034

Jak citovat tuto stránku

ScholarGate. (2026, June 3). Self-supervised Latent Dirichlet Allocation Topic Model. ScholarGate. https://scholargate.app/cs/deep-learning/self-supervised-lda-topic-model

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side
ScholarGateSelf-supervised LDA Topic Model (Self-supervised Latent Dirichlet Allocation Topic Model). Získáno 2026-06-15 z https://scholargate.app/cs/deep-learning/self-supervised-lda-topic-model · Datová sada: https://doi.org/10.5281/zenodo.20539026