Peneliti Stanford dan Google Ajukan DoReMi: Algoritma AI untuk Menimbang Ulang Domain Data dalam Pelatihan Model Bahasa

DoReMi: Algoritma Baru untuk Meningkatkan Kemampuan Pemodelan Bahasa

Pemodelan Bahasa (Language Modeling) adalah teknik yang digunakan untuk menghasilkan model otomatis dalam bahasa manusia. Model ini digunakan dalam berbagai aplikasi seperti pemrosesan bahasa alami dan penyelesaian otomatis masalah. Salah satu faktor penting dalam pemodelan bahasa adalah dataset yang digunakan. Dataset yang bervariasi dapat membantu meningkatkan kinerja model. Namun, pemilihan dataset yang tepat untuk mendapatkan model yang optimal tidaklah mudah.

Untuk mengatasi masalah tersebut, para peneliti dari Google dan Stanford University telah mengembangkan algoritma baru yang disebut Domain Reweighting with Minimax Optimisation (DoReMi). Algoritma ini menggunakan teknik distribusi robuts dan optimasi domain berdasarkan data yang ada. Hal ini dapat membantu meningkatkan kinerja model bahasa dengan meminimalkan loss terburuk di semua domain.

DoReMi memiliki tiga tahap, yaitu (1) melatih model referensi dengan menggunakan bobot domain awal, (2) menyesuaikan model referensi untuk menghasilkan bobot domain yang optimal dengan melatih model kecil menggunakan Group DRO (group distributionally robust optimization) dan (3) melatih model besar (8B) dengan bobot domain yang dioptimalkan.

Dalam pengujian DoReMi pada kumpulan data The Pile dan dataset GLaM, algoritma ini berhasil meningkatkan kinerja model bahasa dengan mengoptimalkan bobot domain. DoReMi bahkan mampu mempercepat waktu training model bahasa pada tugas-tugas tertentu hingga 2,6 kali lebih cepat dibandingkan model baseline yang menggunakan bobot domain default The Pile. Selain itu, DoReMi juga mengungguli algoritma tuning bobot domain pada performa tugas downstream pada dataset GLaM.

DoReMi menawarkan solusi baru untuk meningkatkan kinerja model bahasa dengan mengoptimalkan bobot domain secara efektif. Algoritma ini dapat membantu para peneliti dan praktisi dalam memilih dataset yang tepat dan meningkatkan kinerja model bahasa yang digunakan.

Keunggulan DoReMi dalam Meningkatkan Kinerja Model Bahasa

DoReMi memiliki beberapa keunggulan dalam meningkatkan kinerja model bahasa, diantaranya:

1. Mengoptimalkan Bobot Domain dengan Efektif

DoReMi menggunakan teknik distribusi robuts dan optimasi domain untuk menghasilkan bobot domain yang optimal. Hal ini membantu meningkatkan kinerja model bahasa pada berbagai domain dengan meminimalkan loss terburuk di semua domain.

2. Mempercepat Waktu Training Model Bahasa

Dalam pengujian pada tugas-tugas tertentu, DoReMi dapat mempercepat waktu training model bahasa hingga 2,6 kali lebih cepat dibandingkan model baseline. Hal ini dapat membantu meningkatkan efisiensi dan produktivitas dalam pengembangan model bahasa.

3. Mengoptimalkan Kinerja Model Bahasa pada Berbagai Domain

DoReMi dapat meningkatkan kinerja model bahasa pada berbagai domain dengan mengoptimalkan bobot domain. Hal ini membantu para peneliti dan praktisi dalam memilih dataset yang tepat dan meningkatkan kinerja model bahasa yang digunakan.

DoReMi menawarkan solusi baru untuk meningkatkan kinerja model bahasa dengan mengoptimalkan bobot domain secara efektif. Dalam pengembangan model bahasa, pemilihan dataset yang tepat dapat membantu meningkatkan kinerja model. Dengan menggunakan teknik distribusi robuts dan optimasi domain, DoReMi dapat membantu meningkatkan kinerja model bahasa pada berbagai domain dengan meminimalkan loss terburuk di semua domain.

Disarikan dari: Source