Machine learningDeep learning / NLP / CV

Multimodálne odpovedanie na otázky

Multimodálne odpovedanie na otázky (Multimodal QA) je trieda metód hlbokého učenia, ktoré odpovedajú na otázky v prirodzenom jazyku spoločným uvažovaním nad informáciami z viacerých modalít – najčastejšie textu a obrázkov, ale aj videa, zvuku a štruktúrovaných tabuliek. Vďaka prominentnému zavedeniu prostredníctvom benchmarku VQA v roku 2015 sa odvtedy rozšíril do širokej výskumnej oblasti poháňajúcej porozumenie dokumentov, asistenciu pri lekárskej diagnostike a vtelenú AI.

Otvoriť v MethodMindČoskoroVideoČoskoroStiahnuť snímky

Prečítať celú metódu

Len pre členov

Ak si chcete prečítať túto sekciu, prihláste sa s bezplatným účtom.

Prihlásiť sa

Mapa metód

Okolie príbuzných metód — vyberte uzol na preskúmanie.

Multimodálne odpovedanie na otázky

Klasifikácia založená na…Multimodálna klasifikáci…Multimodálne vety vložen…Multimodálna sumarizácia…Multimodálny Transformer Multimodálne rozpoznávan…

Zdroje

Antol, S., Agrawal, A., Lu, J., Mitchell, M., Batra, D., Zitnick, C. L., & Parikh, D. (2015). VQA: Visual Question Answering. Proceedings of the IEEE International Conference on Computer Vision (ICCV), 2425–2433. DOI: 10.1109/ICCV.2015.279 ↗
Xu, P., Zhu, X., & Clifton, D. A. (2023). Multimodal learning with transformers: A survey. IEEE Transactions on Pattern Analysis and Machine Intelligence, 45(10), 12113–12132. DOI: 10.1109/TPAMI.2023.3275156 ↗

Ako citovať túto stránku

ScholarGate. (2026, June 3). Multimodal Question Answering (Cross-Modal QA). ScholarGate. https://scholargate.app/sk/deep-learning/multimodal-question-answering

Ktorá metóda?

Postavte túto metódu vedľa jej najbližších príbuzných a čítajte ich vedľa seba — knižnica vám knihy položí na stôl; voľba je na vás.

Klasifikácia založená na BERTHlboké učenie↔ porovnať
Multimodálna klasifikácia založená na BERTHlboké učenie↔ porovnať
Multimodálne vety vloženiaHlboké učenie↔ porovnať
Multimodálna sumarizácia textuHlboké učenie↔ porovnať
Multimodálny TransformerHlboké učenie↔ porovnať

Porovnať vedľa seba →

Odkazujú sem

Multimodálne rozpoznávanie pomenovaných entít Multimodálna sumarizácia textu

Našli ste na tejto stránke chybu? Nahláste ju alebo navrhnite opravu →