ChatDB: Framework Baru yang Menambahkan Memori Simbolik pada LLMs dalam Bentuk Database

Inovasi Symbolic Memory: Meningkatkan Kemampuan Multi-Hop Reasoning Large Language Models

Large language models (LLMs) seperti GPT-4 dan PaLM 2 telah menjadi bagian yang sangat penting dari sistem AI kontemporer, merevolusi pengolahan bahasa alami dan mengubah berbagai sektor. Namun, LLMs masih memiliki beberapa kekurangan seperti jumlah token terbatas yang dapat diinputkan. Interaksi multi-turn dengan LLMs menghasilkan banyak token yang mudah melebihi batas token input LLMs yang hanya sekitar 32,000. LLMs harus mempertahankan informasi kontekstual selama interaksi dan menghasilkan balasan tergantung pada informasi yang dikumpulkan. Namun, menyatukan semua informasi kontekstual dan memadatkannya ke LLMs dapat dengan mudah melebihi kemampuan pemrosesan LLMs dan menyebabkan akumulasi kesalahan, sehingga model kehilangan jejak percakapan dan menghasilkan respons yang kurang akurat.

Untuk mengatasi masalah ini, para peneliti dari Tsinghua University, Beijing Academy of Artificial Intelligence, dan Zhejiang University mengusulkan inovasi symbolic memory dengan menggunakan database sebagai penyimpanan informasi sejarah untuk LLMs. Mereka menciptakan ChatDB, sebuah kerangka kerja yang terdiri dari dua bagian yaitu LLM controller dan memori. Operasi baca-tulis ke memori dikontrol oleh LLM controller, yang dapat menjadi LLM yang banyak digunakan. Memori LLM, yang bisa simbolik, non-simbolik, atau gabungan keduanya, bertanggung jawab untuk melacak masa lalu dan menyebarkan data sesuai kebutuhan untuk membantu LLM bereaksi terhadap input manusia.

ChatDB menekankan penggunaan database sebagai symbolic memory, memungkinkan penyimpanan data historis yang terorganisir melalui eksekusi bahasa figuratif, yaitu perintah SQL. LLM membuat pernyataan SQL ini. Sebuah database dapat digunakan sebagai symbolic memory dalam situasi yang membutuhkan pencatatan data yang sangat akurat dan panjang seperti penjualan harian dalam sebuah toko. Menggunakan matriks atau teks biasa sebagai memory kurang sesuai. Namun, menggunakan database sebagai symbolic memory eksternal sangat sesuai. Database menggunakan perintah SQL untuk melakukan tindakan yang tepat seperti pengisian data, penghapusan, pembaruan, dan seleksi. Oleh karena itu, penggunaan database sebagai external symbolic memory menjamin kebenaran dan efisiensi dalam mengelola dan memanipulasi data historis, meningkatkan kinerja LLMs dalam situasi yang memerlukan penangkapan dan pemrosesan data yang sangat akurat dan panjang.

Dalam kerangka kerja ChatDB, para peneliti merekomendasikan strategi chain-of-memory untuk lebih mahir menggunakan external symbolic memory, meningkatkan kapasitas LLMs untuk reasoning. Setiap langkah intermediary di ChatDB melibatkan satu atau lebih pernyataan SQL. Proses baca-tulis ke memori diatur oleh LLM controller. Memori menghasilkan data historis dan menyajikan data historis yang relevan untuk merespons input pengguna. Input pengguna diubah menjadi serangkaian tahap operasi memori intermediate melalui teknik chain-of-memory, yang menghasilkan output yang diinginkan. Setiap tahap intermediary dalam ChatDB memerlukan satu atau lebih pernyataan SQL.

ChatDB telah membawa banyak manfaat bagi bidang LLMs. Pertama, mereka menyarankan untuk menambahkan database ke LLMs sebagai external symbolic memory. Hal ini memungkinkan pengarsipan data historis yang terorganisir dan memungkinkan manipulasi data simbolik dan kompleks menggunakan pernyataan SQL. Kedua, mereka dapat secara efektif memanipulasi memori dengan mentransformasi input pengguna menjadi operasi memori intermediate multi-step menggunakan teknik chain-of-memory mereka. Ini meningkatkan efisiensi ChatDB dan memungkinkannya mengelola transaksi database multi-tabel yang rumit dengan lebih tepat dan stabil. Terakhir, penelitian mereka menunjukkan bahwa menambahkan symbolic memory ke LLMs meningkatkan kemampuan multi-hop reasoning dan mengurangi akumulasi kesalahan, memungkinkan ChatDB tampil lebih baik pada dataset sintetis daripada ChatGPT.

Dengan inovasi symbolic memory dan menggunakan database sebagai external symbolic memory, LLMs menjadi lebih efektif dalam memanipulasi data historis dan meningkatkan kemampuan multi-hop reasoning mereka.

Disarikan dari: Sumber