Google telah memperlihatkan kemampuan teknologi AI dan machine learning yang sudah lama mereka kembangkan pada acara I/O 2023. Salah satu aplikasi yang menarik perhatian adalah kemampuan untuk membuat gambar menggunakan teks, dan upaya Google dalam hal ini terwujud dalam Imagen, sebuah alat pembuatan gambar berbasis teks seperti Midjourney dan DALL-E 2. Kini, Google memperkenalkan Imagen Editor, sebuah alat yang memungkinkan pengeditan lokal pada foto dengan menggunakan teks dan sedikit sketsa.
Sub-topik 1: Mengenal Imagen dan Imagen Editor
Imagen Editor adalah alat yang memungkinkan pengeditan terhadap gambar yang sudah ada dengan menggunakan teks. Pengguna hanya perlu memberikan teks yang menjelaskan perubahan yang diinginkan, serta menentukan wilayah tertentu pada gambar yang akan diedit. Proses yang digunakan oleh Imagen Editor adalah proses inpainting, yang mirip dengan proses restorasi gambar atau yang sering disebut sebagai confluence of Google AI dan Adobe Photoshop’s Content Aware Fill. Para peneliti Google mengembangkan encoder baru untuk Imagen Editor dan juga memasukkan modul pendeteksi objek pada AI untuk mengkompensasi mask yang tidak lengkap atau tidak akurat. Selain Imagen Editor, Google juga memperkenalkan EditBench yang berguna untuk mengevaluasi hasil inpainting yang dihasilkan oleh Imagen Editor.
Sub-topik 2: Keterbatasan Penggunaan Imagen Editor
Meskipun Imagen Editor terbukti efektif dalam menghasilkan hasil inpainting yang akurat dan natural, Google belum siap untuk merilis Imagen Editor ke publik. Hal ini disebabkan oleh kekhawatiran Google mengenai penggunaan AI yang bertanggung jawab. Baru-baru ini, Google telah mengusulkan kerangka kerja untuk menjaga pengembangan AI yang bertanggung jawab, dan diharapkan akan ada batasan yang jelas sebelum memberikan akses kepada orang untuk menggunakan alat seperti Imagen Editor. Namun, EditBench, alat evaluasi hasil inpainting yang dihasilkan oleh Imagen Editor, sudah tersedia secara gratis untuk membantu penelitian AI lebih lanjut.
Meskipun Imagen Editor belum bisa diakses oleh publik, ada harapan bahwa model dasar Imagen akan segera diintegrasikan ke dalam Gboard. Dengan Imagen, pengguna dapat dengan mudah membuat gambar hanya dengan memberikan teks yang mendeskripsikan gambar yang diinginkan. Keberadaan Imagen Editor akan memudahkan pengguna untuk mengedit gambar yang sudah ada, bahkan dengan memberikan deskripsi teks yang mudah dipahami. Namun, Google harus memikirkan penggunaan AI yang bertanggung jawab sebelum merilis alat seperti Imagen Editor kepada publik. Kami berharap bahwa batasan yang jelas akan segera ditetapkan dan Imagen Editor dapat segera digunakan oleh pengguna secara luas.
Disarikan dari: Sumber