Machine learning

GPT-Feinabstimmung

GPT-Feinabstimmung passt vortrainierte autoregressive Sprachmodelle wie GPT-2/3/4 oder LLaMA — vorgestellt in der Arbeit von Radford und Kollegen aus dem Jahr 2019 von OpenAI — an domänenspezifische Daten oder an die Befolgung von Anweisungen mittels Reinforcement Learning aus menschlichem Feedback (RLHF) oder DPO an. Sie wird für die Befolgung von Anweisungen, die Domänenanpassung und generative Aufgaben verwendet.

In MethodMind öffnenDemnächstVideoDemnächstDownload slides

Die vollständige Methode lesen

Nur für Mitglieder

Melden Sie sich mit einem kostenlosen Konto an, um diesen Abschnitt zu lesen.

Anmelden

Method map

The neighbourhood of related methods — select a node to explore.

GPT-Feinabstimmung

LoRA und PEFT Random Forest Variationaler Autoencoder Vision Transformer XGBoost Attention Mechanism BERT-Feinabstimmung Natürliche Sprachgenerie…Prompt Engineering Multi-Head Self-Attention

Quellen

Radford, A., Wu, J., Child, R., Luan, D., Amodei, D. & Sutskever, I. (2019). Language Models are Unsupervised Multitask Learners. OpenAI Technical Report. link ↗
Ouyang, L. et al. (2022). Training Language Models to Follow Instructions with Human Feedback. NeurIPS. DOI: 10.48550/arXiv.2203.02155 ↗

So zitieren Sie diese Seite

ScholarGate. (2026, June 1). GPT Fine-Tuning and Instruction Adaptation. ScholarGate. https://scholargate.app/de/deep-learning/gpt-finetuning

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

LoRA und PEFTDeep Learning↔ compare
Random ForestMaschinelles Lernen↔ compare
Variationaler AutoencoderDeep Learning↔ compare
Vision TransformerDeep Learning↔ compare
XGBoostMaschinelles Lernen↔ compare

Compare side by side →

Referenziert von

Attention Mechanism BERT-Feinabstimmung Natürliche Sprachgenerierung Prompt Engineering Multi-Head Self-Attention

Einen Fehler auf dieser Seite entdeckt? Melden oder Korrektur vorschlagen →

Die vollständige Methode lesen

Method map

Quellen

So zitieren Sie diese Seite

Verwandte Methoden

Which method?

Referenziert von