Machine learning

Тонкая настройка GPT

Тонкая настройка GPT адаптирует предварительно обученные авторегрессионные языковые модели, такие как GPT-2/3/4 или LLaMA, представленные в работе OpenAI 2019 года Рэдфордом и коллегами, к предметно-ориентированным данным или к следованию инструкциям посредством обучения с подкреплением на основе обратной связи с человеком (RLHF) или DPO. Она используется для следования инструкциям, адаптации к предметной области и генеративных задач.

Открыть в MethodMindСкороВидеоСкороDownload slides

Читать метод полностью

Только для участников

Войдите с бесплатным аккаунтом, чтобы прочитать этот раздел.

Войти

Method map

The neighbourhood of related methods — select a node to explore.

Тонкая настройка GPT

LoRA и PEFT Случайный лес Вариационный автокодиров…Vision Transformer XGBoost Механизм внимания Дообучение BERT Генерация естественного…Промпт-инжиниринг Многоголовочное самовним…

Источники

Radford, A., Wu, J., Child, R., Luan, D., Amodei, D. & Sutskever, I. (2019). Language Models are Unsupervised Multitask Learners. OpenAI Technical Report. link ↗
Ouyang, L. et al. (2022). Training Language Models to Follow Instructions with Human Feedback. NeurIPS. DOI: 10.48550/arXiv.2203.02155 ↗

Как цитировать эту страницу

ScholarGate. (2026, June 1). GPT Fine-Tuning and Instruction Adaptation. ScholarGate. https://scholargate.app/ru/deep-learning/gpt-finetuning

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

LoRA и PEFTГлубокое обучение↔ compare
Случайный лесМашинное обучение↔ compare
Вариационный автокодировщикГлубокое обучение↔ compare
Vision TransformerГлубокое обучение↔ compare
XGBoostМашинное обучение↔ compare

Compare side by side →

Упоминается в

Механизм внимания Дообучение BERT Генерация естественного языка Промпт-инжиниринг Многоголовочное самовнимание

Нашли ошибку на этой странице? Сообщите о ней или предложите исправление →

Читать метод полностью

Method map

Источники

Как цитировать эту страницу

Связанные методы

Which method?

Упоминается в