Мультимодальна згорткова нейронна мережа
Мультимодальна згорткова нейронна мережа (MM-CNN) обробляє та об'єднує дві або більше вхідних модальностей — таких як зображення та текст, або відео та аудіо — через спеціалізовані згорткові гілки, навчаючи спільне представлення, яке захоплює комплементарні сигнали з кожного джерела. Об'єднане представлення використовується для подальшого завдання, такого як класифікація, регресія або пошук.
Читати метод повністю
Увійдіть із безкоштовним обліковим записом, щоб прочитати цей розділ.
Method map
The neighbourhood of related methods — select a node to explore.
Джерела
- Ngiam, J., Khosla, A., Kim, M., Nam, J., Lee, H., & Ng, A. Y. (2011). Multimodal deep learning. In Proceedings of the 28th International Conference on Machine Learning (ICML), 689–696. link ↗
- Zhang, Y., Yin, C., Li, Y., Li, D., & Tian, Q. (2020). Multimodal intelligence: Representation learning, information fusion, and applications. IEEE Journal of Selected Topics in Signal Processing, 14(3), 478–493. DOI: 10.1109/JSTSP.2020.2987728 ↗
Як цитувати цю сторінку
ScholarGate. (2026, June 3). Multimodal Convolutional Neural Network (MM-CNN). ScholarGate. https://scholargate.app/uk/deep-learning/multimodal-convolutional-neural-network
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Класифікація зображеньГлибоке навчання↔ compare
- Мультимодальна класифікація на основі BERTГлибоке навчання↔ compare
- Багатомодальна рекурентна нейронна мережаГлибоке навчання↔ compare
- Мультимодальний ТрансформерГлибоке навчання↔ compare
- Трансферне навчання зі згортковою нейронною мережеюГлибоке навчання↔ compare
Згадується в
Помітили помилку на цій сторінці? Повідомте про неї або запропонуйте виправлення →