ScholarGate
Assistent
Machine learning

GPT Fine-Tuning

GPT fine-tuning past getrainde autoregressieve taalmodellen zoals GPT-2/3/4 of LLaMA — geïntroduceerd in het werk van OpenAI uit 2019 door Radford en collega's — aan domeinspecifieke data of aan instructieopvolging via reinforcement learning from human feedback (RLHF) of DPO. Het wordt gebruikt voor instructieopvolging, domeinadaptatie en generatieve taken.

Openen in MethodMindBinnenkortVideoBinnenkortDia's downloaden

Lees de volledige methode

Alleen voor leden

Log in met een gratis account om dit onderdeel te lezen.

Inloggen

Methodenkaart

De omgeving van verwante methoden — selecteer een knooppunt om te verkennen.

Bronnen

  1. Radford, A., Wu, J., Child, R., Luan, D., Amodei, D. & Sutskever, I. (2019). Language Models are Unsupervised Multitask Learners. OpenAI Technical Report. link
  2. Ouyang, L. et al. (2022). Training Language Models to Follow Instructions with Human Feedback. NeurIPS. DOI: 10.48550/arXiv.2203.02155

Deze pagina citeren

ScholarGate. (2026, June 1). GPT Fine-Tuning and Instruction Adaptation. ScholarGate. https://scholargate.app/nl/deep-learning/gpt-finetuning

Welke methode?

Plaats deze methode naast haar naaste verwanten en lees ze naast elkaar — de bibliotheek legt de boeken op tafel; de keuze is aan u.

Naast elkaar vergelijken

Geciteerd door

ScholarGateGPT Fine-Tuning (GPT Fine-Tuning and Instruction Adaptation). Geraadpleegd op 2026-06-15 via https://scholargate.app/nl/deep-learning/gpt-finetuning · Gegevensset: https://doi.org/10.5281/zenodo.20539026