Machine learningDeep Learning, Language Models, Parameter Efficient Fine-Tuning

QLoRA

QLoRA é um método eficiente de ajuste fino introduzido por Dettmers et al. em 2023 que permite o ajuste fino de grandes modelos de linguagem usando quantização e adaptação de baixo posto (low-rank adaptation). Ao combinar quantização de 4 bits com LoRA, o QLoRA reduz os requisitos de memória em 75%, permitindo o ajuste fino de modelos com 65 bilhões de parâmetros em GPUs únicas.

Abrir no MethodMindEm breveVídeoEm breveDownload slides

Leia o método completo

Exclusivo para membros

Entre com uma conta gratuita para ler esta seção.

Entrar

Method map

The neighbourhood of related methods — select a node to explore.

QLoRA

Otimização Direta de Pre…Modelos de Difusão Laten…Mamba (Modelo de Espaço…Autoencoders Mascarados

Fontes

Dettmers, T., Pagnoni, A., Holtzman, A., & Contrastive, L. (2023). QLoRA: Efficient finetuning of quantized LLMs. arXiv preprint arXiv:2305.14314. link ↗

Como citar esta página

ScholarGate. (2026, June 3). Efficient Finetuning of Quantized LLMs. ScholarGate. https://scholargate.app/pt/deep-learning/qlora

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Otimização Direta de PreferênciasAprendizado profundo↔ compare
Modelos de Difusão LatenteAprendizado profundo↔ compare
Mamba (Modelo de Espaço de Estados)Aprendizado profundo↔ compare
Autoencoders MascaradosAprendizado profundo↔ compare

Compare side by side →

Referenciado por

Otimização Direta de Preferências

Encontrou um problema nesta página? Relate ou sugira uma correção →

Leia o método completo

Method map

Fontes

Como citar esta página

Métodos relacionados

Which method?

Referenciado por