Machine learning

Dostrajanie GPT

Dostrajanie GPT polega na adaptacji wstępnie wytrenowanych autoregresywnych modeli językowych, takich jak GPT-2/3/4 lub LLaMA — wprowadzonych w pracy OpenAI z 2019 roku przez Radfoda i współpracowników — do danych specyficznych dla danej dziedziny lub do podążania za instrukcjami za pomocą uczenia ze wzmocnieniem na podstawie informacji zwrotnej od człowieka (RLHF) lub DPO. Jest ono wykorzystywane do podążania za instrukcjami, adaptacji domenowej i zadań generatywnych.

Otwórz w MethodMindWkrótceWideoWkrótceDownload slides

Przeczytaj pełny opis metody

Tylko dla członków

Zaloguj się na bezpłatne konto, aby przeczytać tę sekcję.

Zaloguj się

Method map

The neighbourhood of related methods — select a node to explore.

Dostrajanie GPT

LoRA i PEFT Random Forest Autoenkoder wariacyjny Vision Transformer XGBoost Mechanizm uwagi Dostrajanie BERT Generowanie Języka Natur…Inżynieria podpowiedzi Multi-Head Self-Attention

Źródła

Radford, A., Wu, J., Child, R., Luan, D., Amodei, D. & Sutskever, I. (2019). Language Models are Unsupervised Multitask Learners. OpenAI Technical Report. link ↗
Ouyang, L. et al. (2022). Training Language Models to Follow Instructions with Human Feedback. NeurIPS. DOI: 10.48550/arXiv.2203.02155 ↗

Jak cytować tę stronę

ScholarGate. (2026, June 1). GPT Fine-Tuning and Instruction Adaptation. ScholarGate. https://scholargate.app/pl/deep-learning/gpt-finetuning

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

LoRA i PEFTUczenie głębokie↔ compare
Random ForestUczenie maszynowe↔ compare
Autoenkoder wariacyjnyUczenie głębokie↔ compare
Vision TransformerUczenie głębokie↔ compare
XGBoostUczenie maszynowe↔ compare

Compare side by side →

Cytowana przez

Mechanizm uwagi Dostrajanie BERT Generowanie Języka Naturalnego Inżynieria podpowiedzi Multi-Head Self-Attention

Widzisz błąd na tej stronie? Zgłoś go lub zaproponuj poprawkę →

Przeczytaj pełny opis metody

Method map

Źródła

Jak cytować tę stronę

Metody pokrewne

Which method?

Cytowana przez