شبكة LSTM متعددة الوسائط
تمتد شبكة LSTM متعددة الوسائط (Multimodal LSTM) على شبكة الذاكرة طويلة المدى القياسية (Long Short-Term Memory) لمعالجة البيانات المتسلسلة من مصادر إدخال متعددة - مثل النصوص والصوت والفيديو - بشكل مشترك ضمن بنية تكرارية موحدة. من خلال دمج التمثيلات من مصادر مختلفة قبل أو داخل خلايا LSTM، فإنها تلتقط التبعيات الزمنية التي تمتد عبر الوسائط وتتقاطع معها، مما يجعلها نهجًا أساسيًا لمهام مثل تحليل المشاعر، وتوصيف الفيديو، والحوسبة العاطفية.
اقرأ الطريقة كاملة
سجّل الدخول بحساب مجاني لقراءة هذا القسم.
Method map
The neighbourhood of related methods — select a node to explore.
المصادر
- Rajagopalan, S., Tran, L., Rozgic, V., Narayanan, S., Kumar, A., & Ramakrishna, S. (2016). Extending Long Short-Term Memory for Multi-View Structured Learning. In Proceedings of ECCV 2016. Springer. link ↗
- Hochreiter, S., & Schmidhuber, J. (1997). Long Short-Term Memory. Neural Computation, 9(8), 1735–1780. DOI: 10.1162/neco.1997.9.8.1735 ↗
كيف تستشهد بهذه الصفحة
ScholarGate. (2026, June 3). Multimodal Long Short-Term Memory Network. ScholarGate. https://scholargate.app/ar/deep-learning/multimodal-lstm
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- آلية الانتباهالتعلم العميق↔ compare
- وحدة البوابات المتكررة (GRU)التعلم العميق↔ compare
- شبكة الذاكرة قصيرة وطويلة الأمدالتعلم العميق↔ compare
- المحولات متعددة الوسائط (Multimodal Transformers)التعلم العميق↔ compare