Machine learning

Distillation de connaissances

La distillation de connaissances est une technique de compression de modèles, introduite par Geoffrey Hinton et ses collègues en 2015, qui entraîne un petit modèle étudiant à l'aide des sorties de pseudo-étiquettes (soft labels) d'un grand modèle enseignant. Les modèles distillés tels que DistilBERT et TinyBERT atteignent environ 97 % des performances du modèle plus grand tout en s'exécutant beaucoup plus rapidement.

Ouvrir dans MethodMindBientôtVidéoBientôtDownload slides

Lire la méthode complète

Réservé aux membres

Connectez-vous avec un compte gratuit pour lire cette section.

Se connecter

Method map

The neighbourhood of related methods — select a node to explore.

+3 more

Sources

  1. Hinton, G., Vinyals, O. & Dean, J. (2015). Distilling the Knowledge in a Neural Network. NeurIPS Deep Learning Workshop. link
  2. Sanh, V., Debut, L., Chaumond, J. & Wolf, T. (2019). DistilBERT, a distilled version of BERT: smaller, faster, cheaper and lighter. arXiv:1910.01108. link

Comment citer cette page

ScholarGate. (2026, June 1). Knowledge Distillation (Teacher–Student Model Compression). ScholarGate. https://scholargate.app/fr/deep-learning/knowledge-distillation

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Référencée par

ScholarGateKnowledge Distillation (Knowledge Distillation (Teacher–Student Model Compression)). Consulté le 2026-06-15 sur https://scholargate.app/fr/deep-learning/knowledge-distillation · Jeu de données : https://doi.org/10.5281/zenodo.20539026