SwiftSage: Agensi Generatif Inovatif untuk Meningkatkan Kemampuan Perencanaan LLM dengan Mengurangi Biaya Komputasi

Artificial Intelligence (AI) semakin populer dan digunakan di berbagai industri, mulai dari kesehatan, keuangan, e-commerce, hingga media. Dengan adanya Large Language Models seperti GPT, BERT, dan LLaMA, tugas-tugas seperti pemahaman bahasa alami (NLU), penghasilan bahasa alami (NLG), menjawab pertanyaan, pemrograman, dan pengambilan informasi semakin mudah dilakukan. Salah satu contoh penggunaan AI yang terkenal adalah ChatGPT yang dibangun dengan teknologi transformer GPT 3.5 dan GPT 4.

Namun, meskipun kemampuan AI semakin berkembang, untuk membuat agen AI yang mampu menyelesaikan tugas seperti yang dilakukan manusia masih menjadi tantangan. Tiga pendekatan utama dalam mengembangkan agen yang bisa menyelesaikan tugas interaktif yang kompleks adalah Deep Reinforcement Learning (RL), Behavior Cloning (BC) melalui Sequence-to-Sequence (seq2seq) Learning, dan Prompting LLMs. Namun, pendekatan RL dan BC memiliki keterbatasan seperti dekomposisi tugas, ketidakmampuan mempertahankan memori jangka panjang, generalisasi ke tugas yang tidak diketahui, dan penanganan pengecualian.

Untuk mengatasi tantangan tersebut, sebuah kerangka kerja yang disebut SWIFTSAGE telah diusulkan. Kerangka kerja ini mengintegrasikan kekuatan behavior cloning dan prompting LLMs untuk meningkatkan kinerja penyelesaian tugas dalam tugas interaktif yang kompleks. SWIFTSAGE terdiri dari dua modul, yaitu modul SWIFT dan modul SAGE. Modul SWIFT mewakili pemikiran cepat dan intuitif seperti Sistem 1 pada manusia, sedangkan modul SAGE mewakili pemikiran analitis seperti Sistem 2 pada manusia.

Modul SWIFT terdiri dari sebuah model bahasa encoder-decoder yang telah disesuaikan pada lintasan aksi dari agen oracle. Modul ini mengkodekan komponen memori jangka pendek seperti tindakan sebelumnya, observasi, lokasi yang dikunjungi, dan keadaan lingkungan saat ini, diikuti dengan menguraikan tindakan individual selanjutnya.

Modul SAGE, di sisi lain, menggunakan LLMs seperti GPT-4 untuk perencanaan dan grounding subtujuan. Saat perencanaan, LLMs dipicu untuk mencari barang yang diperlukan, merencanakan, melacak subtujuan, dan mendeteksi serta memperbaiki kesalahan potensial. Sedangkan saat grounding, LLMs digunakan untuk mengubah subtujuan yang dihasilkan dari tahap perencanaan menjadi urutan tindakan yang dapat dieksekusi.

Kerangka kerja SWIFTSAGE telah diuji pada 30 tugas dari benchmark ScienceWorld dan berhasil mengungguli metode lain seperti SayCan, ReAct, dan Reflexion. Kerangka kerja ini juga mampu melakukan perencanaan tindakan jangka panjang, yang berbeda dengan metode sebelumnya yang hanya menghasilkan tindakan selanjutnya.

Dengan kemampuan yang dimilikinya, SWIFTSAGE memiliki potensi untuk meningkatkan perencanaan tindakan dan kinerja dalam tugas pemikiran yang kompleks.

Kelebihan SWIFTSAGE dalam Mengatasi Tantangan Pemikiran Interaktif yang Kompleks

SWIFTSAGE memiliki beberapa kelebihan dalam mengatasi tantangan pemikiran interaktif yang kompleks. Pertama, kerangka kerja ini mengintegrasikan kekuatan dari dua pendekatan utama yaitu behavior cloning dan prompting LLMs untuk meningkatkan kinerja penyelesaian tugas. Kedua, SWIFTSAGE mampu melakukan perencanaan tindakan jangka panjang, yang berbeda dengan metode sebelumnya yang hanya menghasilkan tindakan selanjutnya. Ketiga, SWIFTSAGE dapat digunakan dalam berbagai industri seperti kesehatan, keuangan, e-commerce, dan media.

Meskipun SWIFTSAGE memiliki beberapa kelebihan, kerangka kerja ini juga memiliki keterbatasan. Pertama, SWIFTSAGE masih belum sepenuhnya mampu meniru kemampuan pemikiran manusia. Kedua, penggunaan LLMs dalam SWIFTSAGE juga dapat memakan waktu dan biaya yang cukup besar. Oleh karena itu, SWIFTSAGE masih perlu dikembangkan lebih lanjut untuk meningkatkan kinerjanya dan mengatasi keterbatasan-keterbatasan tersebut.

Kesimpulan

SWIFTSAGE adalah sebuah kerangka kerja yang mengintegrasikan kekuatan behavior cloning dan prompting LLMs untuk meningkatkan kinerja penyelesaian tugas dalam tugas interaktif yang kompleks. Dengan kemampuan perencanaan tindakan jangka panjang, SWIFTSAGE memiliki potensi untuk meningkatkan perencanaan tindakan dan kinerja dalam tugas pemikiran yang kompleks. Meskipun masih memiliki keterbatasan, SWIFTSAGE dapat digunakan dalam berbagai industri seperti kesehatan, keuangan, e-commerce, dan media. Oleh karena itu, pengembangan SWIFTSAGE lebih lanjut dapat memberikan manfaat bagi dunia industri dan masyarakat secara umum.

Disarikan dari: Link