Multimodální klasifikace založená na RoBERTa
Multimodální klasifikace založená na RoBERTa kombinuje transformerový enkodér RoBERTa — robustně optimalizovanou variantu BERT — s pomocnými modalitami, jako jsou obrázky, strukturovaná metadata nebo tabulková data. Sloučená reprezentace je předána klasifikační hlavě, což modelu umožňuje současně využívat jak bohaté porozumění jazyku, tak signály mimo text.
Přečíst celou metodu
Pro přečtení této sekce se přihlaste s bezplatným účtem.
Method map
The neighbourhood of related methods — select a node to explore.
Zdroje
- Liu, Y., Ott, M., Goyal, N., Du, J., Joshi, M., Chen, D., Levy, O., Lewis, M., Zettlemoyer, L., & Stoyanov, V. (2019). RoBERTa: A Robustly Optimized BERT Pretraining Approach. arXiv preprint arXiv:1907.11692. link ↗
- Kiela, D., Grave, E., Joulin, A., & Mikolov, T. (2018). Efficient Large-Scale Multi-Modal Classification. Proceedings of the AAAI Conference on Artificial Intelligence, 32(1). link ↗
Jak citovat tuto stránku
ScholarGate. (2026, June 3). Multimodal RoBERTa-based Classification (Text + Non-Text Fusion with RoBERTa Encoder). ScholarGate. https://scholargate.app/cs/deep-learning/multimodal-roberta-based-classification
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Klasifikace založená na BERTHluboké učení↔ compare
- Víceúčelová klasifikace založená na BERTHluboké učení↔ compare
- Vícemodální vnoření vět (Multimodal Sentence Embeddings)Hluboké učení↔ compare
- Multimodální TransformerHluboké učení↔ compare
- Klasifikace založená na RoBERTaHluboké učení↔ compare
- Vektorové reprezentace větHluboké učení↔ compare
Našli jste na této stránce chybu? Nahlaste ji nebo navrhněte opravu →