Fine-Tuning di GPT
Il fine-tuning di GPT adatta modelli linguistici autoregressivi pre-addestrati come GPT-2/3/4 o LLaMA — introdotti nel lavoro del 2019 di OpenAI da Radford e colleghi — a dati specifici di dominio o all'esecuzione di istruzioni tramite apprendimento per rinforzo da feedback umano (RLHF) o DPO. Viene utilizzato per l'esecuzione di istruzioni, l'adattamento al dominio e compiti generativi.
Leggi il metodo completo
Accedi con un account gratuito per leggere questa sezione.
Method map
The neighbourhood of related methods — select a node to explore.
Fonti
- Radford, A., Wu, J., Child, R., Luan, D., Amodei, D. & Sutskever, I. (2019). Language Models are Unsupervised Multitask Learners. OpenAI Technical Report. link ↗
- Ouyang, L. et al. (2022). Training Language Models to Follow Instructions with Human Feedback. NeurIPS. DOI: 10.48550/arXiv.2203.02155 ↗
Come citare questa pagina
ScholarGate. (2026, June 1). GPT Fine-Tuning and Instruction Adaptation. ScholarGate. https://scholargate.app/it/deep-learning/gpt-finetuning
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- LoRA e PEFTApprendimento profondo↔ compare
- Random ForestApprendimento automatico↔ compare
- Variational AutoencoderApprendimento profondo↔ compare
- Vision TransformerApprendimento profondo↔ compare
- XGBoostApprendimento automatico↔ compare
Citato da
Hai notato un problema in questa pagina? Segnalalo o proponi una correzione →