Daudzmodālu rekurentā neironu tīkls
Daudzmodālu rekurentais neironu tīkls (Multimodal Recurrent Neural Network) apvieno ievades no divām vai vairākām datu modalitātēm — piemēram, attēliem, tekstu un audio — rekurentā secību apstrādes sistēmā. Tas kodē katru modalitāti atsevišķi, sapludina attēlojumus un pēc tam apstrādā kombinēto signālu, izmantojot rekurentās vienības (RNN, LSTM vai GRU), lai ģenerētu vai klasificētu secīgus izvades datus. Šis dizains padarīja to par pamata pieeju attēlu aprakstīšanā, video aprakstīšanā un audio-vizuālās runas atpazīšanā.
Lasīt pilno metodes aprakstu
Piesakieties ar bezmaksas kontu, lai lasītu šo sadaļu.
Method map
The neighbourhood of related methods — select a node to explore.
Avoti
- Vinyals, O., Toshev, A., Bengio, S., & Erhan, D. (2015). Show and Tell: A Neural Image Caption Generator. IEEE Conference on Computer Vision and Pattern Recognition (CVPR), pp. 3156–3164. DOI: 10.1109/CVPR.2015.7298935 ↗
- Ngiam, J., Khosla, A., Kim, M., Nam, J., Lee, H., & Ng, A. Y. (2011). Multimodal Deep Learning. Proceedings of the 28th International Conference on Machine Learning (ICML), pp. 689–696. link ↗
Kā citēt šo lapu
ScholarGate. (2026, June 3). Multimodal Recurrent Neural Network (MM-RNN). ScholarGate. https://scholargate.app/lv/deep-learning/multimodal-recurrent-neural-network
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Gated Recurrent Unit (GRU)Dziļā mācīšanās↔ compare
- Atmiņas ilgtermiņa īstermiņa (LSTM) arhitektūraDziļā mācīšanās↔ compare
- Multimodāla BERT klasifikācijaDziļā mācīšanās↔ compare
- Daudzmodālu konvolūcijas neironu tīklsDziļā mācīšanās↔ compare
- Daudzmodālu TransformersDziļā mācīšanās↔ compare
- Atkārtotais neironu tīklsDziļā mācīšanās↔ compare
Uz to atsaucas
Pamanījāt kļūdu šajā lapā? Ziņojiet vai ierosiniet labojumu →