Para Peneliti UC Berkeley Kenalkan VIPER, Algoritma Baru untuk Meningkatkan Pembelajaran Penguatan menggunakan Model Prediksi Video Pretrained sebagai Sinyal Reward.

Baru-baru ini, para peneliti dari Universitas California, Berkeley telah mengembangkan sistem baru untuk membuat fungsi hadiah bagi agen pembelajaran penguatan…