Тонкая настройка GPT
Тонкая настройка GPT адаптирует предварительно обученные авторегрессионные языковые модели, такие как GPT-2/3/4 или LLaMA, представленные в работе OpenAI 2019 года Рэдфордом и коллегами, к предметно-ориентированным данным или к следованию инструкциям посредством обучения с подкреплением на основе обратной связи с человеком (RLHF) или DPO. Она используется для следования инструкциям, адаптации к предметной области и генеративных задач.
Читать метод полностью
Войдите с бесплатным аккаунтом, чтобы прочитать этот раздел.
Method map
The neighbourhood of related methods — select a node to explore.
Источники
- Radford, A., Wu, J., Child, R., Luan, D., Amodei, D. & Sutskever, I. (2019). Language Models are Unsupervised Multitask Learners. OpenAI Technical Report. link ↗
- Ouyang, L. et al. (2022). Training Language Models to Follow Instructions with Human Feedback. NeurIPS. DOI: 10.48550/arXiv.2203.02155 ↗
Как цитировать эту страницу
ScholarGate. (2026, June 1). GPT Fine-Tuning and Instruction Adaptation. ScholarGate. https://scholargate.app/ru/deep-learning/gpt-finetuning
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- LoRA и PEFTГлубокое обучение↔ compare
- Случайный лесМашинное обучение↔ compare
- Вариационный автокодировщикГлубокое обучение↔ compare
- Vision TransformerГлубокое обучение↔ compare
- XGBoostМашинное обучение↔ compare
Упоминается в
Нашли ошибку на этой странице? Сообщите о ней или предложите исправление →