Machine learningDeep Learning, Language Models, Parameter Efficient Fine-Tuning

Efficient Finetuning of Quantized LLMs

Die Feinabstimmung großer Sprachmodelle erfordert die Speicherung von Optimierungszuständen und Gradienten, die erheblichen Speicherplatz beanspruchen. QLoRA adressiert dies durch zwei sich ergänzende Techniken: (1) Die Quantisierung reduziert die Gewichte des Basismodells auf 4-Bit-Präzision, was den Speicherbedarf um 75 % senkt. (2) LoRA (Low-Rank Adaptation) fügt eingefrorenen Basisgewichten kleine lernbare Matrizen mit niedrigem Rang hinzu, wodurch die trainierbaren Parameter auf 1-2 % des Modells reduziert werden. Die Kombination ermöglicht die Feinabstimmung massiver Modelle auf Consumer-Hardware. Ein cleverer Trick nutzt die NF4-Quantisierung (normalized float), die trotz extremer Komprimierung den Genauigkeitsverlust minimiert.

In MethodMind öffnenDemnächstVideoDemnächstDownload slides

Die vollständige Methode lesen

Nur für Mitglieder

Melden Sie sich mit einem kostenlosen Konto an, um diesen Abschnitt zu lesen.

Anmelden

Method map

The neighbourhood of related methods — select a node to explore.

QLoRA

Direkte Präferenzoptimie…Latent Diffusion Models Mamba (State Space Model)Masked Autoencoders

Quellen

Dettmers, T., Pagnoni, A., Holtzman, A., & Contrastive, L. (2023). QLoRA: Efficient finetuning of quantized LLMs. arXiv preprint arXiv:2305.14314. link ↗

So zitieren Sie diese Seite

ScholarGate. (2026, June 3). Efficient Finetuning of Quantized LLMs. ScholarGate. https://scholargate.app/de/deep-learning/qlora

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Direkte PräferenzoptimierungDeep Learning↔ compare
Latent Diffusion ModelsDeep Learning↔ compare
Mamba (State Space Model)Deep Learning↔ compare
Masked AutoencodersDeep Learning↔ compare

Compare side by side →

Referenziert von

Direkte Präferenzoptimierung

Einen Fehler auf dieser Seite entdeckt? Melden oder Korrektur vorschlagen →

Die vollständige Methode lesen

Method map

Quellen

So zitieren Sie diese Seite

Verwandte Methoden

Which method?

Referenziert von