Machine learning

GPT Finjustering

GPT finjustering tilpasser forudtrænede autoregressive sprogmodeller som GPT-2/3/4 eller LLaMA — introduceret i OpenAI's arbejde fra 2019 af Radford og kolleger — til domænespecifikke data eller til instruktionsfølgning via forstærkningslæring fra menneskelig feedback (RLHF) eller DPO. Den bruges til instruktionsfølgning, domænetilpasning og generative opgaver.

Åbn i MethodMindSnartVideoSnartDownload slides

Læs hele metoden

Kun for medlemmer

Log ind med en gratis konto for at læse dette afsnit.

Log ind

Method map

The neighbourhood of related methods — select a node to explore.

GPT Finjustering

LoRA og PEFT Random Forest Variational Autoencoder Vision Transformer XGBoost Opmærksomhedsmekanisme BERT Finjustering Naturlig sproggenerering Prompt Engineering Multi-Head Self-Attention

Kilder

Radford, A., Wu, J., Child, R., Luan, D., Amodei, D. & Sutskever, I. (2019). Language Models are Unsupervised Multitask Learners. OpenAI Technical Report. link ↗
Ouyang, L. et al. (2022). Training Language Models to Follow Instructions with Human Feedback. NeurIPS. DOI: 10.48550/arXiv.2203.02155 ↗

Sådan citerer du denne side

ScholarGate. (2026, June 1). GPT Fine-Tuning and Instruction Adaptation. ScholarGate. https://scholargate.app/da/deep-learning/gpt-finetuning

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

LoRA og PEFTDyb læring↔ compare
Random ForestMaskinlæring↔ compare
Variational AutoencoderDyb læring↔ compare
Vision TransformerDyb læring↔ compare
XGBoostMaskinlæring↔ compare

Compare side by side →

Refereret af

Opmærksomhedsmekanisme BERT Finjustering Naturlig sproggenerering Prompt Engineering Multi-Head Self-Attention

Har du fundet en fejl på denne side? Indberet den eller foreslå en rettelse →

Læs hele metoden

Method map

Kilder

Sådan citerer du denne side

Relaterede metoder

Which method?

Refereret af