Machine learningDeep learning / NLP / CV
다중 모드 GRU
다중 모드 GRU는 Gated Recurrent Unit 아키텍처를 확장하여 텍스트, 오디오, 비디오 프레임과 같은 여러 입력 모드의 순차 데이터를 단일 순환 프레임워크 내에서 공동으로 처리합니다. 입력 또는 은닉 상태 수준에서 모드별 인코딩을 융합함으로써 이종 데이터 스트림 전반의 시간적 종속성을 포착하며, 다중 모드 감성 분석, 비디오 이해, 시청각 음성 인식에 널리 사용됩니다.
방법 전문 읽기
회원 전용
로그인무료 계정으로 로그인하면 이 섹션을 읽을 수 있습니다.
Method map
The neighbourhood of related methods — select a node to explore.
출처
- Cho, K., van Merriënboer, B., Gulcehre, C., Bahdanau, D., Bougares, F., Schwenk, H., & Bengio, Y. (2014). Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation. Proceedings of EMNLP 2014, 1724–1734. link ↗
- Zadeh, A., Chen, M., Poria, S., Cambria, E., & Morency, L.-P. (2017). Tensor Fusion Network for Multimodal Sentiment Analysis. Proceedings of EMNLP 2017, 1103–1114. link ↗
이 페이지 인용 방법
ScholarGate. (2026, June 3). Multimodal Gated Recurrent Unit. ScholarGate. https://scholargate.app/ko/deep-learning/multimodal-gru
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Gated Recurrent Unit (GRU)딥러닝↔ compare
- Long Short-Term Memory (LSTM)딥러닝↔ compare
- 멀티모달 BERT 기반 분류딥러닝↔ compare
- 다중 양식 LSTM딥러닝↔ compare
- Multimodal Recurrent Neural Network딥러닝↔ compare
- 다중 모달 트랜스포머딥러닝↔ compare