Microsoft Perkenalkan Algoritma Reprompting Untuk Mencari Pola Pikir Tanpa Intervensi Manusia

Reprompting: Algoritma Baru untuk Mendukung Kemampuan Natural Language Processing

Natural Language Processing (NLP) adalah teknologi yang memungkinkan komputer untuk memproses teks manusia dan memahami maknanya. Dalam beberapa tahun terakhir, teknologi NLP semakin berkembang pesat dengan adanya Large Language Models (LLMs) yang menggunakan teknik prompting yang memungkinkan mereka untuk belajar secara cepat dari beberapa contoh tugas tertentu. Teknologi ini telah memberikan kemungkinan penggunaan pada berbagai bidang seperti penerjemahan mesin, pemahaman bahasa alami, pengisian teks, analisis sentimen, dan pengenalan suara.

Namun, teknik prompting masih memiliki keterbatasan terutama dalam menyelesaikan tugas yang membutuhkan langkah-langkah berulang dan propagasi batasan. Untuk mengatasi hal ini, tim peneliti di Microsoft Research, Redmond, USA, mengembangkan algoritma baru bernama Reprompting.

Reprompting: Algoritma Peningkatan Kemampuan Reasoning Large Language Models

Algoritma Reprompting menggunakan teknik chain-of-thought (CoT) prompting yang memungkinkan LLMs untuk meningkatkan kemampuan reasoning mereka. CoT prompting membantu LLMs melakukan tugas yang membutuhkan pemikiran kompleks dengan memberikan beberapa contoh CoT sebagai panduan selama prompting. Dalam algoritma Reprompting, CoT prompts yang efektif dan berguna dicari secara otomatis tanpa campur tangan manusia.

Metode iteratif sampling yang dikenal sebagai Gibbs sampling digunakan dalam algoritma Reprompting. Metode ini membantu menentukan instruksi terbaik dengan mencoba beberapa opsi dan memilih yang paling efektif. Algoritma ini dimulai dengan sampling CoT recipes awal dengan bantuan zero-shot prompting, di mana LLMs dapat menghasilkan respons tugas tanpa pelatihan sebelumnya. Kemudian, algoritma Reprompting secara iteratif melakukan sampling resep baru dengan menggunakan solusi dari CoT sebelumnya sebagai prompt induk.

Algoritma Reprompting telah diuji pada lima Big-Bench Hard (BBH) tasks yang membutuhkan kemampuan reasoning multistep. BBH berfokus pada tugas-tugas yang dianggap melebihi kemampuan dan potensi LLMs saat ini. Dalam pengujian, Reprompting telah terbukti lebih baik daripada teknik prompting zero-shot, few-shot, dan CoT yang ditulis oleh manusia.

Reprompting untuk Kombinasi Model

Selain itu, Reprompting juga menunjukkan potensi yang signifikan dalam kombinasi model dengan menggunakan beberapa LLMs untuk menginisialisasi dan melakukan sampling resep baru. Hal ini membantu dalam transfer pengetahuan dari model yang lebih kuat ke model yang lebih lemah sehingga menghasilkan performa yang lebih baik. Reprompting bahkan berhasil mengungguli CoT prompting yang ditulis oleh manusia dalam BBH tasks hingga 17 poin. Meskipun demikian, para peneliti menekankan bahwa CoT recipes yang berhasil pada satu model belum tentu bekerja dengan baik pada model lain, sehingga perlu dioptimalkan untuk setiap model.

Reprompting merupakan algoritma otomatis yang berguna dalam menemukan CoT prompts yang efektif untuk LLMs tanpa campur tangan manusia. Algoritma ini sangat berharga dalam mengatasi keterbatasan teknik prompting saat ini dan mencapai performa yang lebih baik dalam menyelesaikan tugas yang membutuhkan pemikiran kompleks.

Artikel ini telah dibuat berdasarkan konteks dari Large Language Models dan algoritma Reprompting yang baru. Algoritma tersebut dikembangkan oleh tim peneliti di Microsoft Research, Redmond, USA. Algoritma Reprompting menggunakan teknik chain-of-thought (CoT) prompting untuk meningkatkan kemampuan reasoning LLMs dan membantu menyelesaikan tugas-tugas yang membutuhkan pemikiran multistep. Reprompting juga menunjukkan potensi yang signifikan dalam kombinasi model untuk mencapai performa yang lebih baik.

Disarikan dari: Citation