QLoRA
QLoRA é um método eficiente de ajuste fino introduzido por Dettmers et al. em 2023 que permite o ajuste fino de grandes modelos de linguagem usando quantização e adaptação de baixo posto (low-rank adaptation). Ao combinar quantização de 4 bits com LoRA, o QLoRA reduz os requisitos de memória em 75%, permitindo o ajuste fino de modelos com 65 bilhões de parâmetros em GPUs únicas.
Leia o método completo
Entre com uma conta gratuita para ler esta seção.
Method map
The neighbourhood of related methods — select a node to explore.
Fontes
- Dettmers, T., Pagnoni, A., Holtzman, A., & Contrastive, L. (2023). QLoRA: Efficient finetuning of quantized LLMs. arXiv preprint arXiv:2305.14314. link ↗
Como citar esta página
ScholarGate. (2026, June 3). Efficient Finetuning of Quantized LLMs. ScholarGate. https://scholargate.app/pt/deep-learning/qlora
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Otimização Direta de PreferênciasAprendizado profundo↔ compare
- Modelos de Difusão LatenteAprendizado profundo↔ compare
- Mamba (Modelo de Espaço de Estados)Aprendizado profundo↔ compare
- Autoencoders MascaradosAprendizado profundo↔ compare
Referenciado por
Encontrou um problema nesta página? Relate ou sugira uma correção →