يمتد إطار عمل التضمين المستقل للمستندات (Semi-supervised Doc2Vec) على إطار عمل متجه الفقرات (Paragraph Vector) الخاص بـ Le و Mikolov (2014) عن طريق تدريب تضمينات مستندات كثيفة على كل من مجموعات البيانات المصنفة وغير المصنفة في وقت واحد، باستخدام تسميات الفئات المتاحة كإشارة مساعدة لتوجيه التمثيل نحو البنية ذات الصلة بالمهمة مع الاستفادة الكاملة من المجموعة غير المصنفة للتعميم.
Le, Q. V., & Mikolov, T. (2014). Distributed Representations of Sentences and Documents. Proceedings of the 31st International Conference on Machine Learning (ICML 2014), PMLR 32(2), 1188–1196. link ↗