Scholar
Gate
Asistenti
Të gjitha fushat
▾
SQ ▾
Rreth nesh
Reference
Pyetja dhe Dizajni
Kampionimi dhe Matja
Analiza
Shkakësia dhe Dëshmia
Raportimi dhe Etika
Kreu
/
Autori
Christiano, P. et al.; Ouyang, L. et al.
Metodat që i atribuohen këtij autori.
1 metodë
Mësimi i thellë
1
Fine-Tuned Reinforcement Learning
2017