Machine learningDeep learning / NLP / CV

Multimodálna sumarizácia textu

Multimodálna sumarizácia textu generuje stručné textové zhrnutie spoločným spracovaním viacerých vstupných modalít – najčastejšie textu a obrázkov, ale aj video snímok alebo zvuku – pomocou modelov hlbokého učenia, ktoré zosúladia vizuálne a lingvistické reprezentácie. Výstupom je zhrnutie v prirodzenom jazyku, ktoré zachytáva podstatný obsah zo všetkých dostupných modalít.

Otvoriť v MethodMindČoskoroVideoČoskoroDownload slides

Prečítať celú metódu

Len pre členov

Ak si chcete prečítať túto sekciu, prihláste sa s bezplatným účtom.

Prihlásiť sa

Method map

The neighbourhood of related methods — select a node to explore.

Zdroje

  1. Zhu, J., Li, H., Liu, T., Zhou, Y., Zhang, J., & Zong, C. (2018). MSMO: Multimodal Summarization with Multimodal Output. Proceedings of the 2018 Conference on Empirical Methods in Natural Language Processing (EMNLP), 4154–4164. link
  2. Zhu, J., Zhou, Y., Zhang, J., Li, H., Zong, C., & Li, C. (2020). Multimodal Summarization with Guidance of Multimodal Reference. Proceedings of the AAAI Conference on Artificial Intelligence, 34(05), 9749–9756. link

Ako citovať túto stránku

ScholarGate. (2026, June 3). Multimodal Text Summarization (Cross-Modal Abstractive and Extractive Summarization). ScholarGate. https://scholargate.app/sk/deep-learning/multimodal-text-summarization

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Odkazujú sem

ScholarGateMultimodal Text Summarization (Multimodal Text Summarization (Cross-Modal Abstractive and Extractive Summarization)). Získané 2026-06-15 z https://scholargate.app/sk/deep-learning/multimodal-text-summarization · Dátová sada: https://doi.org/10.5281/zenodo.20539026