Kemampuan model-model bahasa besa
Disarikan dari: Source
MultiModal-GPT: Model Visi dan Bahasa untuk Dialog Multi-Ronde dengan Manusia
Tim OpenFlamingo Rilis OpenFlamingo v2 dengan Lima Model Multimodal Baru yang Mengungguli Model Sebelumnya pada Skala 3B, 4B, dan 9B
Kenalan dengan PandaGPT: Model AI Foundation yang Mampu Mengikuti Instruksi Data di Enam Modalitas Tanpa Supervisi Eksplisit
Peneliti Stanford dan Google Ajukan DoReMi: Algoritma AI untuk Menimbang Ulang Domain Data dalam Pelatihan Model Bahasa
Microsoft AI Perkenalkan LLaVA-Med: Asisten Bahasa dan Penglihatan Besar yang Efisien untuk Revolusi Penelitian Biomedis dan Percakapan Multimodal yang Canggih dalam Waktu Kurang dari 15 Jam
Peneliti NTU dan Microsoft Usulkan MIMIC-IT: Dataset Instruksi Multi-Modal dalam Skala Besar untuk Peningkatan Konteks