Voyager: A Breakthrough in Artificial Intelligence Learning
Kemajuan teknologi kecerdasan buatan (AI) semakin pesat saat ini, namun masih terdapat masalah besar dalam menciptakan entitas yang sepenuhnya otonom yang dapat merencanakan, menjelajahi, dan belajar di lingkungan terbuka. Metode tradisional mengandalkan tindakan fundamental untuk melatih model melalui reinforcement learning (RL) dan imitation learning, membuat investigasi metodis, interpretabilitas, dan generalisabilitas sulit dilakukan. Namun, terdapat kemajuan baru dalam agen berbasis model bahasa besar (LLM) yang menggunakan informasi dunia yang terkode dalam LLM yang sudah dilatih sebelumnya untuk mengembangkan rencana tindakan yang konsisten atau kebijakan yang dapat dieksekusi. Mereka digunakan dalam kegiatan NLP non-berbadan maupun berbadan seperti game dan robotika.
Voyager adalah agen pembelajaran seumur hidup pertama yang didukung oleh LLM dalam Minecraft, dan selalu menjelajahi dunia baru, memperoleh keterampilan baru, dan membuat penemuan tanpa bantuan manusia. Komponen utama Voyager terdiri dari kurikulum otomatis, kerangka pendidikan yang memprioritaskan penemuan, repositori/tempat penyimpanan keterampilan yang dapat memori dan merecall aktivitas yang kompleks, serta mekanisme pengingat untuk perbaikan program yang secara iteratif mencakup umpan balik dari lingkungan sekitar, kesalahan eksekusi, dan self-verification. Voyager menggunakan kueri kotak hitam untuk berkomunikasi dengan GPT-4, yang menghilangkan kebutuhan untuk menyetel parameter model. Bakat yang diperoleh Voyager cepat berkembang dan mengurangi lupa yang sangat fatal karena waktu-ekstended, dapat diinterpretasikan, dan komposisional.
Subtopik 1: Kelebihan Voyager dalam Video Game Minecraft
Voyager menunjukkan kinerja luar biasa dalam video game Minecraft dan potensi pembelajaran seumur hidup yang kuat. Voyager dapat menemukan 3,3 kali lebih banyak barang langka, melakukan perjalanan 2,3 kali lebih jauh, dan mencapai tonggak penting di pohon teknologi hingga 15,3 kali lebih cepat dari SOTA sebelumnya. Sementara metode lain gagal meluas, Voyager dapat menerapkan perpustakaan keterampilan yang dipelajari dalam lingkungan Minecraft baru untuk melakukan tantangan baru dari awal. Bakat Voyager berkembang pesat berkat sintesis komposisional keterampilan yang kompleks, yang mencegah lupa yang sangat fatal yang menghantui bentuk pembelajaran kontinu lainnya. Kemajuan eksplorasi Voyager dan keadaan agen saat ini dimasukkan ke dalam kurikulum otomatis, yang mengusulkan tugas yang semakin sulit bagi Voyager untuk selesaikan. Dengan “menemukan sebanyak mungkin hal yang berbeda” sebagai tujuan utama, GPT-4 menciptakan garis besar kursus.
Subtopik 2: Keterbatasan dan Pekerjaan Masa Depan
Meskipun kemajuan dari Voyager sangat menjanjikan, masih terdapat beberapa keterbatasan yang perlu diatasi, seperti batasan finansial terkait API GPT-4 yang mahal dan kadang-kadang agent dapat tersandung dan memerlukan bantuan untuk mengembangkan bakat yang tepat. Meskipun demikian, para peneliti yakin bahwa pembaruan di masa depan pada model API GPT dan metode terbaru untuk menyetel LLM sumber terbuka akan menghilangkan kekurangan tersebut. Voyager dapat digunakan sebagai titik awal untuk menciptakan agen generalis efektif tanpa menyetel parameter model. Kapasitas Voyager untuk pembelajaran seumur hidup sangat mengesankan dalam situasi ini. Sistem ini dapat membangun perpustakaan tindakan yang dapat digunakan kembali, dapat diinterpretasikan, dan dapat digeneralisasi untuk melakukan tugas-tugas tertentu.
Kesimpulan
Voyager adalah terobosan dalam pembelajaran kecerdasan buatan dan memiliki potensi besar untuk diterapkan dalam banyak bidang, seperti game dan robotika. Meskipun masih terdapat keterbatasan, namun kemajuan yang ditunjukkan Voyager sangat menjanjikan dan akan membantu meningkatkan kualitas pembelajaran kecerdasan buatan di masa depan.
Disarikan dari: Sumber