Doc2Vec bán giám sát mở rộng khung Paragraph Vector của Le và Mikolov (2014) bằng cách huấn luyện các nhúng tài liệu dày đặc trên cả tập dữ liệu có nhãn và không nhãn đồng thời. Các nhãn lớp có sẵn được sử dụng như một tín hiệu phụ trợ để điều hướng biểu diễn về cấu trúc liên quan đến nhiệm vụ, đồng thời vẫn khai thác toàn bộ tập hợp không nhãn để khái quát hóa.
Le, Q. V., & Mikolov, T. (2014). Distributed Representations of Sentences and Documents. Proceedings of the 31st International Conference on Machine Learning (ICML 2014), PMLR 32(2), 1188–1196. link ↗