Machine learningDeep learning / NLP / CV

Multimodal Gated Recurrent Unit

Một GRU tiêu chuẩn đọc một chuỗi và học thông tin nào cần giữ lại hoặc loại bỏ theo thời gian bằng cách sử dụng các cổng cập nhật (update gates) và cổng đặt lại (reset gates). Trong một thiết lập đa phương thức, mô hình trước tiên mã hóa từng phương thức một cách riêng biệt — ví dụ, nhúng từ cho văn bản và các đặc trưng âm thanh cho âm thanh — sau đó kết hợp các biểu diễn đó trước hoặc trong quá trình hồi quy. Cơ chế cổng sau đó quyết định, tại mỗi bước thời gian, bao nhiêu ngữ cảnh đa phương thức được hợp nhất sẽ được chuyển tiếp và bao nhiêu sẽ bị ghi đè, cho phép mạng học các mẫu thời gian chéo phương thức phong phú mà không mô hình đơn phương thức nào có thể nắm bắt được.

Mở trong MethodMindSắp ra mắtVideoSắp ra mắtDownload slides

Đọc toàn bộ phương pháp

Chỉ dành cho thành viên

Đăng nhập bằng tài khoản miễn phí để đọc phần này.

Đăng nhập

Method map

The neighbourhood of related methods — select a node to explore.

Nguồn tài liệu

  1. Cho, K., van Merriënboer, B., Gulcehre, C., Bahdanau, D., Bougares, F., Schwenk, H., & Bengio, Y. (2014). Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation. Proceedings of EMNLP 2014, 1724–1734. link
  2. Zadeh, A., Chen, M., Poria, S., Cambria, E., & Morency, L.-P. (2017). Tensor Fusion Network for Multimodal Sentiment Analysis. Proceedings of EMNLP 2017, 1103–1114. link

Cách trích dẫn trang này

ScholarGate. (2026, June 3). Multimodal Gated Recurrent Unit. ScholarGate. https://scholargate.app/vi/deep-learning/multimodal-gru

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side
ScholarGateMultimodal GRU (Multimodal Gated Recurrent Unit). Truy cập ngày 2026-06-15 từ https://scholargate.app/vi/deep-learning/multimodal-gru · Bộ dữ liệu: https://doi.org/10.5281/zenodo.20539026