Machine learningDeep learning / NLP / CV

Multimodal textsammanfattning

Multimodal textsammanfattning genererar en koncis textuell sammanfattning genom att gemensamt bearbeta flera inmatningsmodaliteter – oftast text och bilder, men även videobilder eller ljud – med hjälp av djupinlärningsmodeller som anpassar visuella och lingvistiska representationer. Resultatet är en sammanfattning på naturligt språk som fångar framträdande innehåll från alla tillgängliga modaliteter.

Öppna i MethodMindSnartVideoSnartDownload slides

Läs hela metoden

Endast för medlemmar

Logga in med ett kostnadsfritt konto för att läsa avsnittet.

Logga in

Method map

The neighbourhood of related methods — select a node to explore.

Multimodal textsammanfattning

BERT-baserad klassificer…Finjusterad textsummering Multimodal BERT-baserad…Multimodal Question Answ…Multimodal Transformer Domänanpassad textsamman…

Källor

Zhu, J., Li, H., Liu, T., Zhou, Y., Zhang, J., & Zong, C. (2018). MSMO: Multimodal Summarization with Multimodal Output. Proceedings of the 2018 Conference on Empirical Methods in Natural Language Processing (EMNLP), 4154–4164. link ↗
Zhu, J., Zhou, Y., Zhang, J., Li, H., Zong, C., & Li, C. (2020). Multimodal Summarization with Guidance of Multimodal Reference. Proceedings of the AAAI Conference on Artificial Intelligence, 34(05), 9749–9756. link ↗

Så citerar du den här sidan

ScholarGate. (2026, June 3). Multimodal Text Summarization (Cross-Modal Abstractive and Extractive Summarization). ScholarGate. https://scholargate.app/sv/deep-learning/multimodal-text-summarization

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

BERT-baserad klassificeringDjupinlärning↔ compare
Finjusterad textsummeringDjupinlärning↔ compare
Multimodal BERT-baserad klassificeringDjupinlärning↔ compare
Multimodal Question AnsweringDjupinlärning↔ compare
Multimodal TransformerDjupinlärning↔ compare

Compare side by side →

Refereras av

Domänanpassad textsammanfattning Multimodal Question Answering

Hittade du ett fel på sidan? Rapportera eller föreslå en rättelse →

Läs hela metoden

Method map

Källor

Så citerar du den här sidan

Närliggande metoder

Which method?

Refereras av