Model Bahasa Besar Baru (LLMs) Dapat Menggunakan Tools Lebih Efisien dengan Gorilla

Baru-baru ini, teknologi kecerdasan buatan mengalami kemajuan di bidang Large Language Models (LLMs). Saat ini, model-model ini memungkinkan kita untuk memahami bahasa dengan lebih ringkas dan, oleh karena itu, dapat memanfaatkan Natural Language Processing (NLP) dan Natural Language Understanding (NLU) dengan lebih baik. Model-model ini juga menunjukkan kinerja yang sangat baik dalam berbagai tugas, termasuk ringkasan teks, jawaban pertanyaan, pembuatan konten, penerjemahan bahasa, dan lain sebagainya. Model ini bahkan dapat memahami prompt teks yang kompleks, bahkan teks dengan pemikiran dan logika, serta mengidentifikasi pola dan hubungan antara data tersebut.

Namun, meskipun model-model bahasa menunjukkan kinerja yang luar biasa, masih sulit bagi mereka untuk menggunakan tools melalui panggilan API dengan cara yang efisien. Bahkan model-model LLM terkenal seperti GPT-4 sering kesulitan menghasilkan argumen input yang tepat dan sering merekomendasikan panggilan API yang tidak sesuai. Untuk mengatasi masalah ini, para peneliti dari Berkeley dan Microsoft Research telah menciptakan Gorilla, model berbasis LLaMA yang lebih baik daripada GPT-4 dalam menghasilkan panggilan API yang tepat. Gorilla membantu dalam memilih API yang sesuai, meningkatkan kemampuan LLM untuk bekerja dengan tools eksternal untuk melakukan aktivitas tertentu.

Gorilla dan Dataset APIBench

Tim peneliti juga telah membuat dataset APIBench, yang terdiri dari korpus yang cukup besar dari API dengan fungsi yang tumpang tindih. Dataset ini dibuat dengan mengumpulkan model-model publik seperti TorchHub, TensorHub, dan HuggingFace untuk API ML mereka. Setiap permintaan API dari TorchHub dan TensorHub disertakan untuk setiap API, dan 20 model teratas dari HuggingFace untuk setiap kategori tugas dipilih. Selain itu, mereka juga menghasilkan sepuluh permintaan pengguna fiktif untuk setiap API menggunakan metode self-instruct.

Dengan menggunakan dataset APIBench dan dokumentasi retrieval, para peneliti telah menghasilkan model Gorilla yang lebih baik. Gorilla, model dengan 7 miliar parameter, lebih unggul dari GPT-4 dalam hal kebenaran fungsi API dan mengurangi kesalahan yang tidak relevan. Integrasi efektif dari dokumen retriever dengan Gorilla menunjukkan kemungkinan untuk LLM menggunakannya dengan lebih tepat. Kemampuan yang ditingkatkan dalam menghasilkan panggilan API oleh Gorilla dan kemampuannya untuk memodifikasi dokumentasi sesuai kebutuhan meningkatkan aplikabilitas dan keandalan hasil model. Pengembangan ini penting karena memungkinkan LLM untuk mengikuti dokumentasi yang diperbarui secara teratur, memberikan informasi yang lebih akurat dan terbaru kepada pengguna.

Keunggulan Gorilla

Salah satu contoh yang dibagikan oleh para peneliti menunjukkan bagaimana Gorilla secara tepat mengenali tugas dan menawarkan hasil API yang lengkap. Panggilan API yang dihasilkan oleh model menunjukkan GPT-4 menghasilkan permintaan API untuk model-model hipotetis, yang menunjukkan kurangnya pemahaman tentang tugas. Claude memilih library yang salah, menunjukkan kurangnya kemampuan untuk mengenali sumber daya yang tepat. Gorilla, di sisi lain, secara tepat mengenali tugas. Gorilla berbeda dari GPT-4 dan Claude karena kemampuannya dalam menghasilkan panggilan API yang akurat, menunjukkan kinerja yang lebih baik dan pemahaman tugas.

Dalam kesimpulannya, Gorilla adalah penambahan besar untuk daftar model bahasa, karena bahkan dapat mengatasi masalah dalam menghasilkan panggilan API. Kemampuannya memungkinkan pengurangan masalah halusinasi dan keandalan.

Artikel ini menjelaskan bagaimana teknologi LLM semakin maju dan bagaimana Gorilla membantu LLM bekerja lebih efisien dalam menggunakan tools melalui panggilan API. Selain itu, artikel ini juga menjelaskan tentang dataset APIBench dan bagaimana para peneliti menghasilkan model Gorilla yang lebih baik. Gorilla memiliki keunggulan dalam mengenali tugas dan menghasilkan panggilan API yang akurat. Dengan demikian, Gorilla adalah penambahan yang berharga untuk daftar model bahasa saat ini.

Disarikan dari: Link