"Multi-Agent Debate Meningkatkan Rasionalitas Dan Akurasi Fakta Pada Large Language Models"

Keberhasilan Large Language Models (LLMs) dalam menghasilkan teks yang koheren dan memahami permintaan pengguna telah menarik perhatian banyak orang. Beberapa LLMs dengan kemampuan produksi dan pemahaman bahasa yang luar biasa, seperti GPT-3.5 dari OpenAI, multimodal GPT 4 terbaru, dan lain-lain, digunakan secara signifikan oleh industri. Beberapa contoh penggunaannya adalah menghasilkan jawaban yang bermakna untuk pertanyaan, merangkum teks, menerjemahkan bahasa, serta transformasi teks ke teks.

LLMs mampu menghasilkan teks yang koheren, memahami dan merespons permintaan, bahkan belajar dari sejumlah kecil contoh dalam apa yang disebut pembelajaran dengan sedikit contoh (few-shot learning). Dalam few-shot learning, LLMs menggunakan informasi terpandu untuk mengklasifikasikan data baru dengan hanya beberapa sampel pelatihan. Karena LLMs memiliki ruang untuk perbaikan, dalam penelitian terbaru, tim peneliti MIT dan Google Brain mengusulkan pendekatan yang bersifat komplementer berdasarkan ‘multi-agent debate’ untuk meningkatkan kualitas respons bahasa yang dihasilkan oleh LLMs.

Mekanisme baru ini memungkinkan banyak contoh LLM untuk berpartisipasi dalam mengusulkan dan membahas respons dan proses penalaran yang unik selama beberapa putaran, tidak hanya bergantung pada satu contoh model. Tujuannya adalah untuk mencapai jawaban akhir yang telah direview dengan baik dan ditingkatkan melalui kerja sama. Pendekatan tambahan untuk meningkatkan jawaban linguistik ini menggunakan pendekatan ‘society of minds’, yang terinspirasi dari gagasan bahwa kecerdasan kolektif dari beberapa pikiran yang bekerja sama dapat menghasilkan kinerja yang lebih baik dan hasil yang lebih akurat.

Pendekatan ini melibatkan sejumlah model atau agen, yang semuanya diberi pertanyaan yang sama pada awalnya. Dengan memungkinkan model ini untuk secara berulang-ulang mengevaluasi dan merevisi tindakan mereka dengan mempertimbangkan balasan agen lain, tujuannya adalah untuk meningkatkan kinerja model ini. ‘Multi-agent debate’ yang digunakan dalam metode ini telah digunakan untuk meningkatkan penalaran deduktif dan keakuratan faktual dari model bahasa untuk menggunakan diskusi di antara beberapa contoh model bahasa untuk mencapai hasil yang lebih baik pada respons.

Tim peneliti telah mengamati peningkatan yang signifikan dalam penalaran matematis dan strategis menggunakan pendekatan ‘society of minds’, sehingga menunjukkan bagaimana kecerdasan kolektif dari beberapa contoh LLM mengarah pada peningkatan kinerja. Metode yang diusulkan juga mengatasi pembentukan kesimpulan palsu dan halusinasi, kelemahan yang diketahui dari model modern. Tim peneliti menemukan bahwa metode mereka mengurangi kemungkinan kesalahan semacam itu dan meningkatkan nilai fakta dari konten yang dihasilkan.

Salah satu manfaat dari pendekatan ini adalah fleksibilitasnya, karena dapat digunakan dengan LLMs yang sudah ada tanpa memerlukan perubahan yang signifikan. Semua tugas yang diteliti mengikuti proses yang sama, dengan prompt yang sama, memastikan konsistensi dan kemudahan penggunaan. Setelah dievaluasi, tim peneliti mengamati bahwa meningkatkan jumlah agen dalam multi-agent debate atau meningkatkan jumlah putaran debat meningkatkan kinerja model. Juga ditemukan bahwa multi-agent debate dapat memungkinkan dua contoh model bahasa yang berbeda, seperti ChatGPT dan Bard, untuk secara kooperatif menyelesaikan tugas yang tidak dapat mereka selesaikan secara individual.

Dalam kesimpulannya, strategi ‘society of minds’ memiliki potensi untuk secara signifikan meningkatkan kinerja LLM, menciptakan peluang baru untuk kemajuan dalam penciptaan dan pemahaman bahasa. Dengan menggunakan metode ini, LLM dapat memberikan jawaban yang lebih akurat dan dapat diandalkan, memiliki keterampilan penalaran yang lebih tinggi, dan membuat lebih sedikit kesalahan yang sering ditemukan dalam model bahasa.

Keuntungan Multi-Agent Debate

Metode multi-agent debate yang digunakan untuk meningkatkan kinerja LLM memiliki beberapa keuntungan. Pertama, metode ini memungkinkan LLM untuk menghasilkan respons yang lebih akurat dan dapat diandalkan. Dalam beberapa kasus, model bahasa dapat menghasilkan jawaban yang salah atau tidak akurat. Dengan menggunakan multi-agent debate, model bahasa dapat ditingkatkan dengan mempertimbangkan pendapat dari beberapa contoh LLM, sehingga menghasilkan jawaban yang lebih tepat.

Kedua, multi-agent debate memungkinkan LLM untuk memiliki keterampilan penalaran yang lebih tinggi. Dalam beberapa kasus, model bahasa tidak mampu menyelesaikan masalah atau menjawab pertanyaan dengan benar karena kurangnya keterampilan penalaran. Dengan menggunakan multi-agent debate, model bahasa dapat ditingkatkan dengan mempertimbangkan pendapat dari beberapa contoh LLM, sehingga meningkatkan kemampuan mereka untuk menyelesaikan masalah dan menjawab pertanyaan dengan benar.

Ketiga, multi-agent debate dapat mengurangi kesalahan dalam model bahasa. Salah satu kelemahan dalam model bahasa modern adalah pembentukan kesimpulan palsu dan halusinasi. Dengan menggunakan multi-agent debate, model bahasa dapat ditingkatkan dengan mempertimbangkan pendapat dari beberapa contoh LLM, sehingga mengurangi kemungkinan kesalahan semacam itu.

Kelemahan Multi-Agent Debate

Meskipun multi-agent debate memiliki beberapa keuntungan, metode ini juga memiliki beberapa kelemahan. Pertama, metode ini dapat memakan banyak waktu. Karena setiap contoh LLM harus mengusulkan dan membahas respons dan proses penalaran mereka, metode ini dapat memakan banyak waktu dan sumber daya.

Kedua, metode ini memerlukan banyak sumber daya komputasi. Karena setiap contoh LLM harus dieksekusi secara simultan, metode ini memerlukan banyak sumber daya komputasi, yang dapat membuatnya sulit untuk diterapkan pada skala besar.

Ketiga, metode ini memerlukan banyak pemrograman. Karena setiap contoh LLM harus diprogram untuk mengusulkan dan membahas respons dan proses penalaran mereka, metode ini memerlukan banyak pemrograman, yang membuatnya sulit untuk diterapkan pada skala besar.

Meskipun multi-agent debate memiliki beberapa kelemahan, metode ini dapat sangat bermanfaat dalam meningkatkan kinerja LLM. Dengan menggunakan multi-agent debate, LLM dapat menghasilkan respons yang lebih akurat dan dapat diandalkan, memiliki keterampilan penalaran yang lebih tinggi, dan membuat lebih sedikit kesalahan yang sering ditemukan dalam model bahasa.

Disarikan dari: Citation