Machine learningDeep learning / NLP / CV
Multimodal Multilayer Perceptron (MM-MLP)
標準的なMLPは単一のフラットな特徴ベクトルを処理します。現実の問題では、しばしば異なる種類のデータを同時に扱う必要があります。例えば、病院の記録には、数値バイタルサイン、自由記述のメモ、医療画像が含まれる場合があります。ハイブリッドMLPは、各データタイプに独自のエンコーディングブランチ(そのモダリティに特化した小さなサブネットワーク)を与え、それらの表現を連結またはその他の方法でマージして単一の結合ベクトルを作成し、そのベクトルを標準的な全結合層で処理します。このアイデアは、各モダリティが補完的な信号を提供し、MLPが予測タスクにとってどの信号の組み合わせが最も重要かを学習するというものです。
手法の全文を読む
会員限定
ログイン無料アカウントでログインすると、このセクションを読めます。
Method map
The neighbourhood of related methods — select a node to explore.
出典
- Ngiam, J., Khosla, A., Kim, M., Nam, J., Lee, H., & Ng, A. Y. (2011). Multimodal deep learning. In Proceedings of the 28th International Conference on Machine Learning (ICML 2011), pp. 689–696. link ↗
- Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep Learning (Ch. 6: Deep Feedforward Networks). MIT Press. ISBN: 978-0-262-03561-3
このページの引用方法
ScholarGate. (2026, June 3). Multimodal Multilayer Perceptron (MM-MLP). ScholarGate. https://scholargate.app/ja/deep-learning/multimodal-multilayer-perceptron
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- ファイン・チューニングされた多層パーセプトロン深層学習↔ compare
- 多層パーセプトロン (MLP)深層学習↔ compare
- マルチモーダル畳み込みニューラルネットワーク深層学習↔ compare
- マルチモーダル文埋め込み深層学習↔ compare
- マルチモーダル・トランスフォーマー深層学習↔ compare