Rangkaian Saraf Konvolusional Multimod (Multimodal Convolutional Neural Network)
Rangkaian Saraf Konvolusional Multimod (MM-CNN) memproses dan menggabungkan dua atau lebih modaliti input — seperti imej dan teks, atau video dan audio — melalui cabang-cabang konvolusional khusus, mempelajari perwakilan kongsi yang menangkap isyarat pelengkap daripada setiap sumber. Perwakilan gabungan ini mendorong tugas hiliran seperti klasifikasi, regresi, atau perolehan.
Baca kaedah sepenuhnya
Log masuk dengan akaun percuma untuk membaca bahagian ini.
Method map
The neighbourhood of related methods — select a node to explore.
Sumber
- Ngiam, J., Khosla, A., Kim, M., Nam, J., Lee, H., & Ng, A. Y. (2011). Multimodal deep learning. In Proceedings of the 28th International Conference on Machine Learning (ICML), 689–696. link ↗
- Zhang, Y., Yin, C., Li, Y., Li, D., & Tian, Q. (2020). Multimodal intelligence: Representation learning, information fusion, and applications. IEEE Journal of Selected Topics in Signal Processing, 14(3), 478–493. DOI: 10.1109/JSTSP.2020.2987728 ↗
Cara memetik halaman ini
ScholarGate. (2026, June 3). Multimodal Convolutional Neural Network (MM-CNN). ScholarGate. https://scholargate.app/ms/deep-learning/multimodal-convolutional-neural-network
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Klasifikasi ImejPembelajaran Mendalam↔ compare
- Klasifikasi Berasaskan BERT MultimodalPembelajaran Mendalam↔ compare
- Rangkaian Saraf Berulang Multimod (Multimodal Recurrent Neural Network)Pembelajaran Mendalam↔ compare
- Transformer MultimodusPembelajaran Mendalam↔ compare
- Pembelajaran Pindahan dengan Rangkaian Neural KonvolusiPembelajaran Mendalam↔ compare
Dirujuk oleh
Terjumpa masalah pada halaman ini? Laporkan atau cadangkan pembetulan →