Machine learningDeep learning / NLP / CV

Multimodal Doc2Vec (Paragraph Vector with Multi-Source Input)

Το κλασικό Doc2Vec μαθαίνει ένα διάνυσμα σταθερού μήκους για κάθε έγγραφο προβλέποντας λέξεις στο πλαίσιο, αλλά βλέπει μόνο κείμενο. Τα έγγραφα του πραγματικού κόσμου — ειδησεογραφικά άρθρα με φωτογραφίες, καταχωρήσεις προϊόντων με εικόνες και περιγραφές, ή επιστημονικές εργασίες με σχήματα — μεταφέρουν νόημα μέσω πολλαπλών καναλιών. Το Multimodal Doc2Vec αντιμετωπίζει αυτό κωδικοποιώντας κάθε τροπικότητα σε μια δική της ενδιάμεση αναπαράσταση και στη συνέχεια συγχωνεύοντας αυτές τις αναπαραστάσεις, εκπαιδεύοντας το συνδυασμένο διάνυσμα εγγράφου έτσι ώστε τα σήματα κειμένου και οπτικά (ή άλλα) σήματα να ενισχύουν το ένα το άλλο. Το αποτέλεσμα είναι μια ενσωμάτωση που αντικατοπτρίζει το πλήρες έγγραφο και όχι μόνο τις λέξεις του.

Άνοιγμα στο MethodMindΣύντομαΒίντεοΣύντομαDownload slides

Διαβάστε ολόκληρη τη μέθοδο

Μόνο για μέλη

Συνδεθείτε με δωρεάν λογαριασμό για να διαβάσετε αυτή την ενότητα.

Σύνδεση

Method map

The neighbourhood of related methods — select a node to explore.

Πηγές

  1. Le, Q. V., & Mikolov, T. (2014). Distributed Representations of Sentences and Documents. Proceedings of the 31st International Conference on Machine Learning (ICML), PMLR 32(2), 1188–1196. link
  2. Ngiam, J., Khosla, A., Kim, M., Nam, J., Lee, H., & Ng, A. Y. (2011). Multimodal Deep Learning. Proceedings of the 28th International Conference on Machine Learning (ICML), 689–696. link

Πώς να παραπέμψετε σε αυτή τη σελίδα

ScholarGate. (2026, June 3). Multimodal Doc2Vec (Paragraph Vector with Multi-Source Input). ScholarGate. https://scholargate.app/el/deep-learning/multimodal-doc2vec

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Αναφέρεται από

ScholarGateMultimodal Doc2Vec (Multimodal Doc2Vec (Paragraph Vector with Multi-Source Input)). Ανακτήθηκε στις 2026-06-15 από https://scholargate.app/el/deep-learning/multimodal-doc2vec · Σύνολο δεδομένων: https://doi.org/10.5281/zenodo.20539026