Peningkatan Metode D-Adaptation untuk Optimasi Machine Learning
Machine learning modern sangat bergantung pada optimasi untuk memberikan jawaban efektif terhadap masalah-masalah yang menantang dalam bidang seperti computer vision, natural language processing, dan reinforcement learning. Tingkat keberhasilan dalam mencapai konvergensi yang cepat dan solusi berkualitas tinggi sangat bergantung pada pemilihan learning rates. Aplikasi dengan banyak agen, masing-masing dengan optimizernya sendiri, membuat penyesuaian learning rate semakin sulit. Beberapa optimizernya yang disetel secara manual memang berperforma baik, namun metode-metode ini biasanya membutuhkan keahlian khusus dan kerja yang melelahkan. Oleh karena itu, dalam beberapa tahun terakhir, metode “parameter-free” adaptive learning rate seperti pendekatan D-Adaptation semakin populer untuk optimasi tanpa learning rate.
Tim peneliti dari Samsung AI Center dan Meta AI memperkenalkan dua perubahan unik pada metode D-Adaptation yang disebut Prodigy dan Resetting untuk meningkatkan kecepatan konvergensi non-asymptotic terburuk dari metode D-Adaptation, sehingga menghasilkan kecepatan konvergensi yang lebih cepat dan output optimasi yang lebih baik.
Peningkatan Konvergensi dan Kualitas Solusi Metode D-Adaptation
Para penulis memperkenalkan dua perubahan baru pada metode asli untuk meningkatkan kecepatan konvergensi dan performa kualitas solusi dari metode D-Adaptation. Mereka meningkatkan kecepatan konvergensi algoritma dan performa kualitas solusi dengan melakukan penyesuaian pada metode adaptive learning rate. Batas bawah untuk metode apapun yang menyesuaikan jarak ke konstanta solusi D ditetapkan untuk memverifikasi penyesuaian yang diusulkan. Mereka juga menunjukkan bahwa dibandingkan dengan metode lain dengan pertumbuhan iterasi yang dibatasi secara eksponensial, pendekatan yang ditingkatkan ini adalah optimal terburuk dalam kasus terbaik hingga faktor konstan. Pengujian luas kemudian dilakukan untuk menunjukkan bahwa metode D-Adaptation yang ditingkatkan meningkatkan learning rate dengan cepat, menghasilkan tingkat konvergensi dan hasil optimasi yang lebih baik.
Strategi inovatif tim melibatkan penyesuaian error term D-Adaptation dengan Adagrad-like step sizes. Peneliti sekarang dapat mengambil langkah-langkah yang lebih besar dengan percaya diri sambil tetap menjaga error term utama tetap utuh, sehingga metode yang telah ditingkatkan ini dapat konvergen lebih cepat. Algoritma ini melambat saat penyebut dalam step size menjadi terlalu besar. Oleh karena itu, mereka juga menambahkan bobot di sebelah gradien sebagai langkah pencegahan.
Para peneliti menggunakan teknik yang diusulkan untuk memecahkan masalah regresi logistik konveks dan tantangan pembelajaran serius dalam penelitian empiris mereka. Dalam berbagai studi, Prodigy telah menunjukkan adopsi yang lebih cepat daripada pendekatan lain yang diketahui; D-Adaptation dengan resetting mencapai tingkat teoretis yang sama dengan Prodigy sementara menggunakan teori yang jauh lebih sederhana daripada baik Prodigy maupun D-Adaptation. Selain itu, metode yang diusulkan seringkali mengungguli algoritma D-Adaptation dan dapat mencapai akurasi uji yang sebanding dengan Adam yang disetel manual.
Metode Baru yang Melampaui Pendekatan D-Adaptation
Dua metode yang baru-baru ini diusulkan telah melampaui pendekatan D-adaption terkini dalam penyesuaian learning rate. Bukti eksperimental yang luas menunjukkan bahwa Prodigy, varian D-Adaptation yang diberi bobot, lebih adaptif daripada pendekatan yang sudah ada. Telah ditunjukkan bahwa metode kedua, D-Adaptation dengan resetting, dapat mencapai tingkat teoretis yang sama dengan Prodigy dengan teori yang jauh lebih sederhana.
Dalam kesimpulan, penelitian ini mengusulkan perubahan pada metode D-Adaptation untuk optimasi machine learning. Metode yang ditingkatkan ini mempercepat konvergensi dan meningkatkan kualitas solusi dengan penyesuaian learning rate yang adaptif. Dengan adanya penemuan ini, diharapkan optimasi machine learning dapat mencapai hasil yang lebih baik dan lebih cepat dalam berbagai aplikasi, seperti computer vision, natural language processing, dan reinforcement learning.
Disarikan dari: Sumber