FastSAM: Solusi Terbaru yang Mencapai Segmentasi Berkualitas Tinggi dengan Beban Komputasi Minimal

Metode FastSAM Menawarkan Solusi Real-Time untuk Segmentasi Objek dalam Gambar

Metode FastSAM adalah inovasi terbaru dalam bidang segmentasi objek dalam gambar. Dalam sebuah penelitian yang dilakukan oleh tim peneliti dari China, FastSAM dikembangkan untuk mengatasi tantangan dalam implementasi praktis dari model Segment Anything (SAM).

SAM adalah model yang dapat membagi-bagi objek dalam gambar dengan akurat. Dengan menggunakan model Transformer yang telah dilatih secara ekstensif pada dataset SA-1B, SAM mampu menghadapi berbagai situasi dan objek yang berbeda. Dengan kata lain, segmentasi objek apa pun kini memungkinkan berkat adanya SAM. Kemampuan ini memiliki potensi untuk menjadi dasar dalam berbagai tantangan visi di masa depan karena sifat umumnya.

Namun, salah satu tantangan utama dalam arsitektur SAM adalah kebutuhan pemrosesan yang tinggi dari model Transformer (ViT) dibandingkan dengan model konvolusional. Oleh karena itu, tim peneliti menciptakan FastSAM sebagai solusi real-time untuk masalah segmentasi objek. Dalam FastSAM, tugas segmentasi objek dibagi menjadi dua bagian: segmentasi semua instansi dan seleksi berdasarkan bantuan prompt. Tahap pertama melibatkan penggunaan detektor berbasis Convolutional Neural Network (CNN) untuk menghasilkan masker segmentasi untuk setiap instansi dalam gambar. Tahap kedua menampilkan wilayah yang sesuai dengan masukan pengguna.

Berbeda dengan SAM yang memanfaatkan model Transformer, FastSAM menggunakan pendekatan YOLACT yang didasarkan pada detektor objek YOLOv8-seg. Meskipun hanya menggunakan 2% dari dataset SA-1B, FastSAM tetap mampu mencapai performa yang sebanding dengan SAM. Keunggulan FastSAM terletak pada kemampuan untuk beroperasi dalam waktu nyata dengan konstrain komputasi dan sumber daya yang lebih rendah. FastSAM juga memiliki performa yang baik dalam tugas segmentasi turunan.

Metode FastSAM memiliki berbagai aplikasi praktis dalam industri. Kecepatannya yang tinggi membuatnya cocok untuk identifikasi rintangan jalan, pelacakan objek dalam video, dan pengeditan gambar. FastSAM juga mampu menghasilkan masker berkualitas tinggi untuk objek besar dalam foto. Dalam penelitian ini, FastSAM berhasil menjalankan empat tugas zero-shot dengan kecepatan 50 kali lebih cepat dari SAM-ViT-H.

Kesimpulan

Metode FastSAM menawarkan solusi real-time untuk segmentasi objek dalam gambar. Dibandingkan dengan model SAM, FastSAM mampu mencapai performa yang sebanding sambil beroperasi 50 hingga 170 kali lebih cepat. Kecepatan FastSAM membuatnya cocok untuk berbagai aplikasi industri, seperti identifikasi rintangan jalan dan pelacakan objek dalam video. Selain itu, FastSAM juga mampu menghasilkan masker berkualitas tinggi untuk objek besar dalam foto. Hasil penelitian ini menunjukkan bahwa pendekatan dengan menggunakan model Convolutional Neural Network (CNN) dapat menjadi alternatif yang efisien dalam tugas segmentasi objek. Dengan begitu, FastSAM memberikan kontribusi penting dalam pengembangan teknologi visi komputer dan membuka potensi penggunaan yang luas dalam berbagai bidang komersial.

Disarikan dari: Link