GPT Fine-Tuning
GPT fine-tuning past getrainde autoregressieve taalmodellen zoals GPT-2/3/4 of LLaMA — geïntroduceerd in het werk van OpenAI uit 2019 door Radford en collega's — aan domeinspecifieke data of aan instructieopvolging via reinforcement learning from human feedback (RLHF) of DPO. Het wordt gebruikt voor instructieopvolging, domeinadaptatie en generatieve taken.
Lees de volledige methode
Log in met een gratis account om dit onderdeel te lezen.
Methodenkaart
De omgeving van verwante methoden — selecteer een knooppunt om te verkennen.
Bronnen
- Radford, A., Wu, J., Child, R., Luan, D., Amodei, D. & Sutskever, I. (2019). Language Models are Unsupervised Multitask Learners. OpenAI Technical Report. link ↗
- Ouyang, L. et al. (2022). Training Language Models to Follow Instructions with Human Feedback. NeurIPS. DOI: 10.48550/arXiv.2203.02155 ↗
Deze pagina citeren
ScholarGate. (2026, June 1). GPT Fine-Tuning and Instruction Adaptation. ScholarGate. https://scholargate.app/nl/deep-learning/gpt-finetuning
Welke methode?
Plaats deze methode naast haar naaste verwanten en lees ze naast elkaar — de bibliotheek legt de boeken op tafel; de keuze is aan u.
- LoRA en PEFTDeep learning↔ vergelijken
- Random ForestMachine learning↔ vergelijken
- Variational AutoencoderDeep learning↔ vergelijken
- Transformator voor Visuele WaarnemingDeep learning↔ vergelijken
- XGBoostMachine learning↔ vergelijken
Geciteerd door
Een fout op deze pagina gezien? Meld het of stel een correctie voor →