Machine learningDeep learning / NLP / CV
רשת קונבולוציה רב-אופנית (Multimodal Convolutional Neural Network)
רשת קונבולוציה רב-אופנית (MM-CNN) מעבדת וממזגת שתי אופנויות קלט או יותר — כגון תמונות וטקסט, או וידאו ואודיו — באמצעות ענפי קונבולוציה ייעודיים, ולומדת ייצוג משותף הלוכד אותות משלימים מכל מקור. הייצוג הממוזג מניע משימה במורד הזרם כגון סיווג, רגרסיה או אחזור.
קראו את השיטה במלואה
לחברים בלבד
התחברותהתחברו עם חשבון חינמי כדי לקרוא חלק זה.
Method map
The neighbourhood of related methods — select a node to explore.
מקורות
- Ngiam, J., Khosla, A., Kim, M., Nam, J., Lee, H., & Ng, A. Y. (2011). Multimodal deep learning. In Proceedings of the 28th International Conference on Machine Learning (ICML), 689–696. link ↗
- Zhang, Y., Yin, C., Li, Y., Li, D., & Tian, Q. (2020). Multimodal intelligence: Representation learning, information fusion, and applications. IEEE Journal of Selected Topics in Signal Processing, 14(3), 478–493. DOI: 10.1109/JSTSP.2020.2987728 ↗
איך לצטט עמוד זה
ScholarGate. (2026, June 3). Multimodal Convolutional Neural Network (MM-CNN). ScholarGate. https://scholargate.app/he/deep-learning/multimodal-convolutional-neural-network
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- סיווג תמונהלמידה עמוקה↔ compare
- סיווג מבוסס BERT רב-מודאלילמידה עמוקה↔ compare
- רשת עצבית רקורנטית רב-אופניתלמידה עמוקה↔ compare
- טרנספורמר רב-מודאלילמידה עמוקה↔ compare
- למידת העברה עם רשת קונבולוציהלמידה עמוקה↔ compare