“Bisa Kah Model Bahasa Menciptakan Ide Ilmiah Baru? Temukan Konsep Contextualized Literature-Based Discovery (C-LBD)”

Para peneliti dari University of Illinois at Urbana-Champaign, Hebrew University of Jerusalem, dan Allen Institute for Artificial Intelligence (AI2) telah mengembangkan model baru bernama Contextual Literature-Based Discovery (C-LBD) untuk mengatasi masalah kompleksitas yang ada dalam literature-based discovery (LBD). C-LBD menggunakan setting natural language untuk membatasi space generation untuk LBD dan juga membuka jalan bagi output yang lebih ekspresif dengan menghasilkan kalimat-kalimat baru.

Dalam LBD, hipotesis dihasilkan dari penggabungan ide-ide yang sebelumnya belum pernah dihubungkan, seperti hubungan baru antara obat-dan-penyakit. Meskipun telah berkembang menjadi metodologi machine-learning, LBD memiliki beberapa masalah. Pertama, hipotesis yang dihasilkan tidak se-ekspresif jika bahasa ilmiah direduksi ke bentuk yang paling dasar. Kedua, LBD tidak memperhitungkan faktor-faktor yang dipertimbangkan oleh ahli ilmuwan selama proses ideasi, seperti lingkungan aplikasi yang dimaksudkan, persyaratan dan batasan, insentif, dan masalah. Terakhir, sifat induktif dan generatif ilmu pengetahuan, di mana konsep-konsep baru dan kombinasi-kombinasi mereka terus-menerus berkembang, tidak dipertimbangkan dalam konteks LBD transduktif, di mana semua konsep diketahui sebagai apriori dan perlu dihubungkan.

Dengan inspirasi dari asisten berbasis AI yang dapat memberikan saran dalam bahasa Inggris yang mudah dipahami, para peneliti mengembangkan C-LBD. Asisten menerima informasi yang relevan, seperti tantangan saat ini, motif, dan kendala, serta frasa benih yang harus menjadi fokus utama dari konsep ilmiah yang dikembangkan. Dengan informasi ini, tim melakukan investigasi pada dua bentuk C-LBD: satu yang menghasilkan kalimat lengkap yang menjelaskan suatu ide, dan yang lainnya menghasilkan hanya komponen-komponen penting dari ide tersebut.

Dalam rangka mencapai hal tersebut, tim memperkenalkan kerangka pemodelan baru untuk CLBD yang dapat mencari inspirasi dari sumber-sumber yang berbeda (seperti grafik pengetahuan ilmiah) dan menggunakannya untuk membentuk hipotesis baru. Mereka juga memperkenalkan model kontras kontekstual yang menggunakan kalimat latar belakang sebagai negatif untuk mencegah emulasi input yang tidak sah dan mempromosikan pemikiran kreatif. Berbeda dengan sebagian besar penelitian LBD yang diarahkan pada aplikasi biomedis, eksperimen ini berlaku untuk artikel-artikel di bidang ilmu komputer. Dari 67.408 makalah di antologi ACL, tim membuat dataset baru secara otonom menggunakan sistem IE, lengkap dengan tugas, metode, dan anotasi kalimat latar belakang.

Sub-topik 1: Implementasi dan Kelebihan C-LBD

Dalam penelitian ini, para peneliti fokus pada bidang NLP untuk menganalisis hasil. Hasil evaluasi otomatis dan manusia menunjukkan bahwa pengambilan hipotesis yang ditingkatkan dengan retrieval secara signifikan lebih unggul dibandingkan dengan metode sebelumnya, namun model generatif state-of-the-art saat ini masih tidak memadai untuk pekerjaan ini.

Para peneliti yakin bahwa perluasan C-LBD untuk mencakup analisis multimodal dari rumus, tabel, dan gambar untuk memberikan konteks latar belakang yang lebih komprehensif dan kaya merupakan arah yang menarik untuk diteliti di masa depan. Penggunaan LLM canggih seperti GPT-4, yang saat ini sedang dikembangkan, juga menjadi hal yang harus diinvestigasi.

Sub-topik 2: Kendala dalam Pengembangan C-LBD

Meskipun C-LBD menjanjikan, terdapat beberapa kendala dalam pengembangannya. Salah satunya adalah kurangnya data yang tersedia untuk dilatih dan dievaluasi. Selain itu, C-LBD masih memiliki keterbatasan dalam mempertimbangkan konteks sosial dan budaya dalam hipotesis yang dihasilkan. Juga, keakuratan hipotesis tergantung pada kualitas informasi yang diberikan sebagai input. Oleh karena itu, dibutuhkan perhatian lebih pada pengumpulan data yang berkualitas dan perumusan informasi input yang tepat.

Kesimpulan

Dalam bidang penelitian, C-LBD menawarkan pendekatan baru dalam menghasilkan hipotesis yang lebih ekspresif dan kontekstual. Meskipun masih dalam tahap pengembangan dan memiliki beberapa kendala dalam praktiknya, C-LBD menjanjikan untuk menjadi model baru yang dapat menghasilkan hipotesis ilmiah dengan lebih baik dan akurat.

Disarikan dari: Source