준지도 Doc2Vec은 Le과 Mikolov (2014)의 Paragraph Vector 프레임워크를 확장하여, 사용 가능한 클래스 레이블을 보조 신호로 사용하여 표현을 작업 관련 구조로 유도하는 동시에 일반화를 위해 전체 비레이블 데이터를 활용하면서, 레이블이 있는 데이터와 레이블이 없는 데이터를 모두 사용하여 밀집 문서 임베딩을 훈련합니다.
Le, Q. V., & Mikolov, T. (2014). Distributed Representations of Sentences and Documents. Proceedings of the 31st International Conference on Machine Learning (ICML 2014), PMLR 32(2), 1188–1196. link ↗