SGD s momentom / Adam Optimizer
Stochastický gradientový zostup (SGD) s momentom a jeho adaptívny potomok Adam sú základné algoritmy aktualizácie parametrov používané na trénovanie prakticky každého moderného modelu hlbokého učenia. Momentum SGD formalizoval Polyak (1964) a do trénovania neurónových sietí ho priniesli Rumelhart, Hinton a Williams (1986). Adam, predstavený Kingmom a Ba na ICLR 2015, rozšíril myšlienku momentu udržiavaním bežiaceho priemeru štvorcov gradientov, čím produkoval adaptívne miery učenia pre každý parameter zvlášť, čo z neho robí predvolený optimalizátor v súčasnej praxi hlbokého učenia.
Prečítať celú metódu
Ak si chcete prečítať túto sekciu, prihláste sa s bezplatným účtom.
Mapa metód
Okolie príbuzných metód — vyberte uzol na preskúmanie.
Zdroje
- Kingma, D. P., & Ba, J. (2015). Adam: A method for stochastic optimization. International Conference on Learning Representations (ICLR 2015). arXiv:1412.6980. link ↗
- Rumelhart, D. E., Hinton, G. E., & Williams, R. J. (1986). Learning representations by back-propagating errors. Nature, 323, 533–536. DOI: 10.1038/323533a0 ↗
- Polyak, B. T. (1964). Some methods of speeding up the convergence of iteration methods. USSR Computational Mathematics and Mathematical Physics, 4(5), 1–17. DOI: 10.1016/0041-5553(64)90137-5 ↗
- Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep Learning (Ch. 8: Optimization for Training Deep Models). MIT Press. ISBN: 978-0-262-03561-3
Ako citovať túto stránku
ScholarGate. (2026, June 3). Stochastic Gradient Descent with Momentum and Adaptive Moment Estimation (Adam). ScholarGate. https://scholargate.app/sk/deep-learning/stochastic-gradient-descent-with-momentum-adam-optimizer
Ktorá metóda?
Postavte túto metódu vedľa jej najbližších príbuzných a čítajte ich vedľa seba — knižnica vám knihy položí na stôl; voľba je na vás.
- Normalizácia dávkyHlboké učenie↔ porovnať
Similar methods
Našli ste na tejto stránke chybu? Nahláste ju alebo navrhnite opravu →