Multimodal Gated Recurrent Unit
Một GRU tiêu chuẩn đọc một chuỗi và học thông tin nào cần giữ lại hoặc loại bỏ theo thời gian bằng cách sử dụng các cổng cập nhật (update gates) và cổng đặt lại (reset gates). Trong một thiết lập đa phương thức, mô hình trước tiên mã hóa từng phương thức một cách riêng biệt — ví dụ, nhúng từ cho văn bản và các đặc trưng âm thanh cho âm thanh — sau đó kết hợp các biểu diễn đó trước hoặc trong quá trình hồi quy. Cơ chế cổng sau đó quyết định, tại mỗi bước thời gian, bao nhiêu ngữ cảnh đa phương thức được hợp nhất sẽ được chuyển tiếp và bao nhiêu sẽ bị ghi đè, cho phép mạng học các mẫu thời gian chéo phương thức phong phú mà không mô hình đơn phương thức nào có thể nắm bắt được.
Đọc toàn bộ phương pháp
Đăng nhập bằng tài khoản miễn phí để đọc phần này.
Method map
The neighbourhood of related methods — select a node to explore.
Nguồn tài liệu
- Cho, K., van Merriënboer, B., Gulcehre, C., Bahdanau, D., Bougares, F., Schwenk, H., & Bengio, Y. (2014). Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation. Proceedings of EMNLP 2014, 1724–1734. link ↗
- Zadeh, A., Chen, M., Poria, S., Cambria, E., & Morency, L.-P. (2017). Tensor Fusion Network for Multimodal Sentiment Analysis. Proceedings of EMNLP 2017, 1103–1114. link ↗
Cách trích dẫn trang này
ScholarGate. (2026, June 3). Multimodal Gated Recurrent Unit. ScholarGate. https://scholargate.app/vi/deep-learning/multimodal-gru
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Cổng Lặp Lại Có Cổng (GRU)Học sâu↔ compare
- Mạng bộ nhớ dài-ngắn hạn (LSTM)Học sâu↔ compare
- Phân loại dựa trên BERT đa phương thứcHọc sâu↔ compare
- Multimodal LSTMHọc sâu↔ compare
- Mạng nơ-ron hồi quy đa phương thứcHọc sâu↔ compare
- Transformer Đa phương thứcHọc sâu↔ compare
Phát hiện lỗi trên trang này? Báo cáo hoặc đề xuất chỉnh sửa →