Machine learningDeep learning / NLP / CV

Multimodálna klasifikácia založená na BERT

Multimodálna klasifikácia založená na BERT rozširuje transformačnú architektúru BERT na spoločné kódovanie a klasifikáciu dát z viacerých modalít — najčastejšie textu spárovaného s obrázkami — fúziou ich reprezentácií pred finálnou klasifikačnou hlavou. Predstavená prominentne okolo roku 2019 prostredníctvom modelov ako MMBT a ViLBERT sa stala štandardným prístupom pre úlohy, kde ani samotný text, ani samotný obrázok neobsahuje dostatok informácií na presné označenie.

Otvoriť v MethodMindČoskoroVideoČoskoroDownload slides

Prečítať celú metódu

Len pre členov

Ak si chcete prečítať túto sekciu, prihláste sa s bezplatným účtom.

Prihlásiť sa

Method map

The neighbourhood of related methods — select a node to explore.

Multimodálna klasifikácia založená na BERT

CLIP Vision Transformer Konvolučná neurónová sie…Multimodálny difúzny mod…Multimodálny Doc2Vec Multimodal Graph Neural…Multimodálna GRU Multimodálna klasifikáci…Multimodal LDA Topic Mod…Multimodálne rozpoznávan…

+8 more

Zdroje

Kiela, D., Bhooshan, S., Firooz, H., Perez, E., & Testuggine, D. (2019). Supervised multimodal bitransformers for classifying images and text. arXiv preprint arXiv:1909.02950. link ↗
Lu, J., Batra, D., Parikh, D., & Lee, S. (2019). ViLBERT: Pretraining task-agnostic visiolinguistic representations for vision-and-language tasks. Advances in Neural Information Processing Systems, 32. link ↗

Ako citovať túto stránku

ScholarGate. (2026, June 3). Multimodal BERT-based Classification (Transformer Fusion of Text and Non-text Modalities). ScholarGate. https://scholargate.app/sk/deep-learning/multimodal-bert-based-classification

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

CLIPHlboké učenie↔ compare
Vision TransformerHlboké učenie↔ compare

Compare side by side →

Odkazujú sem

Konvolučná neurónová sieť s viacerými modalitami Multimodálny difúzny model Multimodálny Doc2Vec Multimodal Graph Neural Network Multimodálna GRU Multimodálna klasifikácia obrazu Multimodal LDA Topic Model Multimodálne rozpoznávanie pomenovaných entít Multimodálne odpovedanie na otázky Multimodálna rekurentná neurónová sieť Multimodálna klasifikácia založená na RoBERTa Multimodálna sumarizácia textu Multimodálne modelovanie tém Multimodálny Transformer Multimodálny Transformer pre víziu Multimodálne Word2Vec

Našli ste na tejto stránke chybu? Nahláste ju alebo navrhnite opravu →

Prečítať celú metódu

Method map

Zdroje

Ako citovať túto stránku

Príbuzné metódy

Which method?

Odkazujú sem