Machine learning

GPT Fine-Tuning

GPT fine-tuning past getrainde autoregressieve taalmodellen zoals GPT-2/3/4 of LLaMA — geïntroduceerd in het werk van OpenAI uit 2019 door Radford en collega's — aan domeinspecifieke data of aan instructieopvolging via reinforcement learning from human feedback (RLHF) of DPO. Het wordt gebruikt voor instructieopvolging, domeinadaptatie en generatieve taken.

Openen in MethodMindBinnenkortVideoBinnenkortDia's downloaden

Lees de volledige methode

Alleen voor leden

Inloggen

Methodenkaart

De omgeving van verwante methoden — selecteer een knooppunt om te verkennen.

GPT Fine-Tuning

LoRA en PEFT Random Forest Variational Autoencoder Transformator voor Visue…XGBoost Attention Mechanism BERT Fine-Tuning Natuurlijke Taalgeneratie Prompt Engineering Multi-Head Self-Attention

Bronnen

Radford, A., Wu, J., Child, R., Luan, D., Amodei, D. & Sutskever, I. (2019). Language Models are Unsupervised Multitask Learners. OpenAI Technical Report. link ↗
Ouyang, L. et al. (2022). Training Language Models to Follow Instructions with Human Feedback. NeurIPS. DOI: 10.48550/arXiv.2203.02155 ↗

Deze pagina citeren

ScholarGate. (2026, June 1). GPT Fine-Tuning and Instruction Adaptation. ScholarGate. https://scholargate.app/nl/deep-learning/gpt-finetuning

Welke methode?

Plaats deze methode naast haar naaste verwanten en lees ze naast elkaar — de bibliotheek legt de boeken op tafel; de keuze is aan u.

LoRA en PEFTDeep learning↔ vergelijken
Random ForestMachine learning↔ vergelijken
Variational AutoencoderDeep learning↔ vergelijken
Transformator voor Visuele WaarnemingDeep learning↔ vergelijken
XGBoostMachine learning↔ vergelijken

Naast elkaar vergelijken →

Geciteerd door

Attention Mechanism BERT Fine-Tuning Natuurlijke Taalgeneratie Prompt Engineering Multi-Head Self-Attention

Een fout op deze pagina gezien? Meld het of stel een correctie voor →

Lees de volledige methode

Methodenkaart

Bronnen

Deze pagina citeren

Verwante methoden

Welke methode?

Geciteerd door