Multimodaal Convolutie Neuraal Netwerk
Een Multimodaal Convolutie Neuraal Netwerk (MM-CNN) verwerkt en fuseert twee of meer invoermodaliteiten — zoals beelden en tekst, of video en audio — via specifieke convolutievertakkingen, waarbij een gedeelde representatie wordt geleerd die complementaire signalen uit elke bron vastlegt. De gefuseerde representatie stuurt een downstreamtaak aan, zoals classificatie, regressie of retrieval.
Lees de volledige methode
Log in met een gratis account om dit onderdeel te lezen.
Method map
The neighbourhood of related methods — select a node to explore.
Bronnen
- Ngiam, J., Khosla, A., Kim, M., Nam, J., Lee, H., & Ng, A. Y. (2011). Multimodal deep learning. In Proceedings of the 28th International Conference on Machine Learning (ICML), 689–696. link ↗
- Zhang, Y., Yin, C., Li, Y., Li, D., & Tian, Q. (2020). Multimodal intelligence: Representation learning, information fusion, and applications. IEEE Journal of Selected Topics in Signal Processing, 14(3), 478–493. DOI: 10.1109/JSTSP.2020.2987728 ↗
Deze pagina citeren
ScholarGate. (2026, June 3). Multimodal Convolutional Neural Network (MM-CNN). ScholarGate. https://scholargate.app/nl/deep-learning/multimodal-convolutional-neural-network
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- BeeldclassificatieDeep learning↔ compare
- Multimodale BERT-gebaseerde classificatieDeep learning↔ compare
- Multimodaal Recurrent Neural NetworkDeep learning↔ compare
- Multimodale TransformerDeep learning↔ compare
- Transfer Learning met Convolutional Neural NetworkDeep learning↔ compare
Geciteerd door
Een fout op deze pagina gezien? Meld het of stel een correctie voor →