ScholarGate
Assistent
Machine learningDeep learning / NLP / CV

Multimodaal Convolutie Neuraal Netwerk

Een Multimodaal Convolutie Neuraal Netwerk (MM-CNN) verwerkt en fuseert twee of meer invoermodaliteiten — zoals beelden en tekst, of video en audio — via specifieke convolutievertakkingen, waarbij een gedeelde representatie wordt geleerd die complementaire signalen uit elke bron vastlegt. De gefuseerde representatie stuurt een downstreamtaak aan, zoals classificatie, regressie of retrieval.

Openen in MethodMindBinnenkortVideoBinnenkortDownload slides

Lees de volledige methode

Alleen voor leden

Log in met een gratis account om dit onderdeel te lezen.

Inloggen

Method map

The neighbourhood of related methods — select a node to explore.

Bronnen

  1. Ngiam, J., Khosla, A., Kim, M., Nam, J., Lee, H., & Ng, A. Y. (2011). Multimodal deep learning. In Proceedings of the 28th International Conference on Machine Learning (ICML), 689–696. link
  2. Zhang, Y., Yin, C., Li, Y., Li, D., & Tian, Q. (2020). Multimodal intelligence: Representation learning, information fusion, and applications. IEEE Journal of Selected Topics in Signal Processing, 14(3), 478–493. DOI: 10.1109/JSTSP.2020.2987728

Deze pagina citeren

ScholarGate. (2026, June 3). Multimodal Convolutional Neural Network (MM-CNN). ScholarGate. https://scholargate.app/nl/deep-learning/multimodal-convolutional-neural-network

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Geciteerd door

ScholarGateMultimodal Convolutional Neural Network (Multimodal Convolutional Neural Network (MM-CNN)). Geraadpleegd op 2026-06-15 via https://scholargate.app/nl/deep-learning/multimodal-convolutional-neural-network · Gegevensset: https://doi.org/10.5281/zenodo.20539026