Machine learning

GPT peenhäälestus

GPT peenhäälestus kohandab eelkoolitatud autoregressiivseid keelemudeleid, nagu GPT-2/3/4 või LLaMA — mida tutvustas OpenAI 2019. aasta töös Radford ja kolleegid — domeenispetsiifiliste andmete või juhiste järgimise jaoks läbi inimtagasisidest juhitava tugevdusõppe (RLHF) või DPO. Seda kasutatakse juhiste järgimiseks, domeenide kohandamiseks ja generatiivseteks ülesanneteks.

Ava rakenduses MethodMindPeagiVideoPeagiDownload slides

Loe meetodi täielikku kirjeldust

Ainult liikmetele

Selle osa lugemiseks logi sisse tasuta kontoga.

Logi sisse

Method map

The neighbourhood of related methods — select a node to explore.

GPT peenhäälestus

LoRA ja PEFT Juhuslik mets Variational Autoencoder Vision Transformer XGBoost Tähelepanu mehhanism BERT-mudeli täpsustamine Keelestruktuuride automa…Promptide insenering Mitmepealine enesetähele…

Allikad

Radford, A., Wu, J., Child, R., Luan, D., Amodei, D. & Sutskever, I. (2019). Language Models are Unsupervised Multitask Learners. OpenAI Technical Report. link ↗
Ouyang, L. et al. (2022). Training Language Models to Follow Instructions with Human Feedback. NeurIPS. DOI: 10.48550/arXiv.2203.02155 ↗

Kuidas sellele lehele viidata

ScholarGate. (2026, June 1). GPT Fine-Tuning and Instruction Adaptation. ScholarGate. https://scholargate.app/et/deep-learning/gpt-finetuning

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side →

Sellele viitavad

Tähelepanu mehhanism BERT-mudeli täpsustamine Keelestruktuuride automaatne genereerimine Promptide insenering Mitmepealine enesetähelepanu

Märkasid sellel lehel viga? Teata sellest või paku parandust →

Loe meetodi täielikku kirjeldust

Method map

Allikad

Kuidas sellele lehele viidata

Seotud meetodid

Which method?

Sellele viitavad