Microsoft AI Perkenalkan LLaVA-Med: Asisten Bahasa Dan Penglihatan Besar Yang Efisien Untuk Revolusi Penelitian Biomedis Dan Percakapan Multimodal Yang Canggih Dalam Waktu Kurang Dari 15 Jam

Microsoft Rilis Model AI untuk Mendukung Profesional Kesehatan

Microsoft merilis model AI terbaru bernama Large Language and Vision Assistant for BioMedicine (LLaVA-Med). Model ini dirancang khusus untuk membantu profesional kesehatan dalam memahami gambar biomedis dan merespons pertanyaan yang berkaitan dengan gambar tersebut. Model ini telah dilatih selama kurang dari 15 jam menggunakan delapan A100s.

Model AI LLaVA-Med dibuat dengan menggunakan teknologi pembelajaran kurikulum yang memungkinkan model ini memahami kosakata biomedis dan dapat memahami instruksi yang diberikan oleh pengguna. Model ini juga telah dilengkapi dengan kemampuan untuk mengikuti instruksi tindak lanjut secara bebas.

Model ini dilatih menggunakan lebih dari 600 ribu pasangan gambar-teks biomedis dari PubMed Central dan model AI GPT-4 untuk menghasilkan data instruksi yang dibutuhkan. Model ini juga telah dilengkapi dengan kemampuan untuk mengenali konsep biomedis yang lebih kompleks.

Dengan kemampuan multi-modalnya, LLaVA-Med dapat membantu profesional medis dalam memahami gambar biomedis dan menjawab pertanyaan-pertanyaan yang berkaitan dengan gambar tersebut dengan lebih mudah dan cepat. Model ini juga dapat membantu dalam memperkuat kinerja sistem jawaban pertanyaan visual biomedis.

Meskipun model AI LLaVA-Med masih memiliki kelemahan seperti halusinasi dan kurangnya kedalaman dalam penalaran, namun model ini merupakan langkah besar dalam mendukung pengembangan teknologi multi-modal untuk bidang biomedis.

Kurikulum Pembelajaran AI pada LLaVA-Med

LLaVA-Med menggunakan teknologi pembelajaran kurikulum untuk memperoleh pengetahuan biomedis. Dalam pembelajaran kurikulum ini, LLaVA-Med dilatih secara bertahap mulai dari pemahaman kosakata biomedis hingga kemampuan untuk mengikuti instruksi tindak lanjut secara bebas.

Metode pengajaran ini terbukti efektif dan berhasil meningkatkan kemampuan model AI dalam memahami dan merespons gambar biomedis. Proses pelatihan juga dilakukan dengan menggunakan dataset yang beragam dan lengkap untuk meningkatkan kemampuan LLaVA-Med dalam memahami berbagai aspek biomedis.

LLaVA-Med juga dilengkapi dengan kemampuan zero-shot task transfer yang memungkinkan model ini dapat mengenali dan menjawab pertanyaan tentang gambar biomedis tanpa perlu dilatih terlebih dahulu. Selain itu, LLaVA-Med juga dilengkapi dengan kemampuan untuk berinteraksi dengan pengguna secara alami dan mengikuti instruksi yang diberikan pengguna.

Kontribusi Microsoft dalam Pengembangan AI untuk Bidang Biomedis

Model AI LLaVA-Med merupakan salah satu kontribusi dari Microsoft dalam pengembangan teknologi AI untuk bidang biomedis. Dengan adanya model AI ini, diharapkan dapat membantu profesional kesehatan dalam memahami dan merespons gambar biomedis dengan lebih mudah dan cepat.

Selain itu, Microsoft juga merilis dataset multi-modal instruksi biomedis yang dapat digunakan untuk pengembangan teknologi AI lainnya dalam bidang biomedis. Dataset ini merupakan salah satu upaya Microsoft dalam meningkatkan kualitas dan kuantitas data untuk pengembangan teknologi AI di masa depan.

Secara keseluruhan, model AI LLaVA-Med merupakan salah satu langkah besar Microsoft dalam mendukung pengembangan teknologi AI untuk bidang biomedis. Model ini dilengkapi dengan kemampuan multi-modal dan mampu mengenali konsep biomedis yang kompleks, sehingga diharapkan dapat membantu profesional kesehatan dalam memahami gambar biomedis dengan lebih baik.

Disarikan dari: Source