Multimodalna konvolucijska neuronska mreža
Multimodalna konvolucijska neuronska mreža (MM-CNN) obrađuje i spaja dvije ili više ulaznih modalnosti — poput slika i teksta, ili videa i zvuka — putem namjenskih konvolucijskih grana, učeći zajedničku reprezentaciju koja obuhvaća komplementarne signale iz svakog izvora. Spojena reprezentacija pokreće daljnji zadatak poput klasifikacije, regresije ili dohvaćanja.
Pročitajte cijelu metodu
Prijavite se besplatnim računom kako biste pročitali ovaj odjeljak.
Method map
The neighbourhood of related methods — select a node to explore.
Izvori
- Ngiam, J., Khosla, A., Kim, M., Nam, J., Lee, H., & Ng, A. Y. (2011). Multimodal deep learning. In Proceedings of the 28th International Conference on Machine Learning (ICML), 689–696. link ↗
- Zhang, Y., Yin, C., Li, Y., Li, D., & Tian, Q. (2020). Multimodal intelligence: Representation learning, information fusion, and applications. IEEE Journal of Selected Topics in Signal Processing, 14(3), 478–493. DOI: 10.1109/JSTSP.2020.2987728 ↗
Kako citirati ovu stranicu
ScholarGate. (2026, June 3). Multimodal Convolutional Neural Network (MM-CNN). ScholarGate. https://scholargate.app/hr/deep-learning/multimodal-convolutional-neural-network
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Klasifikacija slikaDuboko učenje↔ compare
- Multimodalna klasifikacija utemeljena na BERT-uDuboko učenje↔ compare
- Višemodalna rekurentna neuronska mrežaDuboko učenje↔ compare
- Multimodalni TransformerDuboko učenje↔ compare
- Preneseno učenje s konvolucijskim neuronskim mrežamaDuboko učenje↔ compare
Citirana u
Uočili ste pogrešku na ovoj stranici? Prijavite je ili predložite ispravak →