Machine learning

Fine-Tuning GPT

Fine-tuning GPT mengadaptasi model bahasa autoregresif yang telah dilatih sebelumnya seperti GPT-2/3/4 atau LLaMA — yang diperkenalkan dalam karya Radford dan rekan-rekannya pada tahun 2019 oleh OpenAI — ke data spesifik domain atau untuk mengikuti instruksi melalui pembelajaran penguatan dari umpan balik manusia (RLHF) atau DPO. Ini digunakan untuk mengikuti instruksi, adaptasi domain, dan tugas generatif.

Buka di MethodMindSegeraVideoSegeraDownload slides

Baca metode selengkapnya

Khusus anggota

Masuk dengan akun gratis untuk membaca bagian ini.

Masuk

Method map

The neighbourhood of related methods — select a node to explore.

Fine-Tuning GPT

LoRA dan PEFT Random Forest Variational Autoencoder Vision Transformer XGBoost Mekanisme Perhatian Fine-Tuning BERT Generasi Bahasa Alami Rekayasa Prompt Multi-Head Self-Attention

Sumber

Radford, A., Wu, J., Child, R., Luan, D., Amodei, D. & Sutskever, I. (2019). Language Models are Unsupervised Multitask Learners. OpenAI Technical Report. link ↗
Ouyang, L. et al. (2022). Training Language Models to Follow Instructions with Human Feedback. NeurIPS. DOI: 10.48550/arXiv.2203.02155 ↗

Cara menyitasi halaman ini

ScholarGate. (2026, June 1). GPT Fine-Tuning and Instruction Adaptation. ScholarGate. https://scholargate.app/id/deep-learning/gpt-finetuning

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

LoRA dan PEFTPembelajaran Mendalam↔ compare
Random ForestPembelajaran Mesin↔ compare
Variational AutoencoderPembelajaran Mendalam↔ compare
Vision TransformerPembelajaran Mendalam↔ compare
XGBoostPembelajaran Mesin↔ compare

Compare side by side →

Dirujuk oleh

Mekanisme Perhatian Fine-Tuning BERT Generasi Bahasa Alami Rekayasa Prompt Multi-Head Self-Attention

Menemukan masalah di halaman ini? Laporkan atau usulkan perbaikan →

Baca metode selengkapnya

Method map

Sumber

Cara menyitasi halaman ini

Metode terkait

Which method?

Dirujuk oleh