Machine learningDeep Learning, Language Models, Parameter Efficient Fine-Tuning

Efficient Finetuning of Quantized LLMs

Η λεπτομερής ρύθμιση μεγάλων γλωσσικών μοντέλων απαιτεί την αποθήκευση καταστάσεων βελτιστοποιητή (optimizer states) και κλίσεων (gradients), οι οποίες καταναλώνουν σημαντική μνήμη. Το QLoRA αντιμετωπίζει αυτό μέσω δύο συμπληρωματικών τεχνικών: (1) Η κβαντοποίηση μειώνει τα βάρη του βασικού μοντέλου σε ακρίβεια 4-bit, μειώνοντας τη μνήμη κατά 75%. (2) Η LoRA (Low-Rank Adaptation) προσθέτει μικρές, εκπαιδεύσιμες μήτρες χαμηλής τάξης σε παγωμένα βασικά βάρη, μειώνοντας τις εκπαιδεύσιμες παραμέτρους στο 1-2% του μοντέλου. Ο συνδυασμός επιτρέπει τη λεπτομερή ρύθμιση τεράστιων μοντέλων σε καταναλωτικό υλικό. Ένα έξυπνο τέχνασμα χρησιμοποιεί κβαντοποίηση NF4 (normalized float) που ελαχιστοποιεί την απώλεια ακρίβειας παρά την ακραία συμπίεση.

Άνοιγμα στο MethodMindΣύντομαΒίντεοΣύντομαDownload slides

Διαβάστε ολόκληρη τη μέθοδο

Μόνο για μέλη

Συνδεθείτε με δωρεάν λογαριασμό για να διαβάσετε αυτή την ενότητα.

Σύνδεση

Method map

The neighbourhood of related methods — select a node to explore.

QLoRA

Βελτιστοποίηση Άμεσης Πρ…Μοντέλα Διάχυσης σε Λανθ…Mamba (Μοντέλο Χώρου Κατ…Μασκοφόροι Αυτοκωδικοποι…

Πηγές

Dettmers, T., Pagnoni, A., Holtzman, A., & Contrastive, L. (2023). QLoRA: Efficient finetuning of quantized LLMs. arXiv preprint arXiv:2305.14314. link ↗

Πώς να παραπέμψετε σε αυτή τη σελίδα

ScholarGate. (2026, June 3). Efficient Finetuning of Quantized LLMs. ScholarGate. https://scholargate.app/el/deep-learning/qlora

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Βελτιστοποίηση Άμεσης ΠροτίμησηςΒαθιά Μάθηση↔ compare
Μοντέλα Διάχυσης σε Λανθάνοντα ΧώροΒαθιά Μάθηση↔ compare
Mamba (Μοντέλο Χώρου Καταστάσεων)Βαθιά Μάθηση↔ compare
Μασκοφόροι ΑυτοκωδικοποιητέςΒαθιά Μάθηση↔ compare

Compare side by side →

Αναφέρεται από

Βελτιστοποίηση Άμεσης Προτίμησης

Εντοπίσατε πρόβλημα σε αυτή τη σελίδα; Αναφέρετέ το ή προτείνετε διόρθωση →

Διαβάστε ολόκληρη τη μέθοδο

Method map

Πηγές

Πώς να παραπέμψετε σε αυτή τη σελίδα

Συναφείς μέθοδοι

Which method?

Αναφέρεται από