GPT finjustering
GPT finjustering tilpasser forhåndstrente autoregressive språkmodeller som GPT-2/3/4 eller LLaMA — introdusert i OpenAI's arbeid fra 2019 av Radford og kolleger — til domenespesifikke data eller til instruksjonsfølging via forsterkningslæring fra menneskelig tilbakemelding (RLHF) eller DPO. Den brukes for instruksjonsfølging, domenetilpasning og generative oppgaver.
Les hele metoden
Logg inn med en gratis konto for å lese denne delen.
Method map
The neighbourhood of related methods — select a node to explore.
Kilder
- Radford, A., Wu, J., Child, R., Luan, D., Amodei, D. & Sutskever, I. (2019). Language Models are Unsupervised Multitask Learners. OpenAI Technical Report. link ↗
- Ouyang, L. et al. (2022). Training Language Models to Follow Instructions with Human Feedback. NeurIPS. DOI: 10.48550/arXiv.2203.02155 ↗
Slik siterer du denne siden
ScholarGate. (2026, June 1). GPT Fine-Tuning and Instruction Adaptation. ScholarGate. https://scholargate.app/no/deep-learning/gpt-finetuning
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- LoRA og PEFTDyp læring↔ compare
- Random ForestMaskinlæring↔ compare
- VariasjonsautoenkoderDyp læring↔ compare
- Vision TransformerDyp læring↔ compare
- XGBoostMaskinlæring↔ compare
Referert av
Funnet en feil på denne siden? Rapporter eller foreslå en rettelse →