Machine learningDeep Learning, Language Models, Parameter Efficient Fine-Tuning
QLoRA
QLoRAは、Dettmersらによって2023年に導入された効率的なファインチューニング手法であり、量子化と低ランクアダプテーション(LoRA)を組み合わせて大規模言語モデル(LLM)のファインチューニングを可能にします。4ビット量子化とLoRAを組み合わせることで、QLoRAはメモリ要件を75%削減し、65Bパラメータモデルのファインチューニングを単一GPUで可能にします。
手法の全文を読む
会員限定
ログイン無料アカウントでログインすると、このセクションを読めます。
Method map
The neighbourhood of related methods — select a node to explore.
出典
- Dettmers, T., Pagnoni, A., Holtzman, A., & Contrastive, L. (2023). QLoRA: Efficient finetuning of quantized LLMs. arXiv preprint arXiv:2305.14314. link ↗
このページの引用方法
ScholarGate. (2026, June 3). Efficient Finetuning of Quantized LLMs. ScholarGate. https://scholargate.app/ja/deep-learning/qlora
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
Compare side by side →