Peneliti Perluas Kerangka Kerja RelPose Untuk Memprediksi Rotasi Relatif Pada Gambar

AI Mampu Mendeteksi 6D Posisi Kamera dari Beberapa Foto

Sebuah tim peneliti dari Carnegie Mellon University telah berhasil mengembangkan sistem AI yang dapat mendeteksi posisi (coarse) 6D untuk objek generik, seperti robot Fetch, dari sejumlah foto yang terbatas. Metode yang dikembangkan oleh tim peneliti ini disebut RelPose++, yang mampu menentukan rotasi dan translasi kamera 6D dari sekumpulan foto terbatas. RelPose++ menggunakan pendekatan top-down dan memperluas metode RelPose, yang memproyeksikan distribusi pada rotasi relatif pasangan gambar sebelum mengoptimalkan hipotesis rotasi multiview yang konsisten. Yang menarik dari metode ini adalah RelPose++ dapat mempertimbangkan konteks gambar dari sejumlah foto yang diinputkan untuk memperkirakan distribusi rotasi relatif pasangan kamera yang lebih baik.

Metode yang dikembangkan oleh tim peneliti ini dapat memulihkan posisi kamera 6D untuk objek dalam kategori yang terlihat dan tidak terlihat hanya dengan menggunakan beberapa foto, setelah dilatih pada 41 jenis dari dataset CO3D. RelPose++ terbukti 25% lebih baik dalam akurasi prediksi rotasi dibandingkan dengan metode sparse-view terdepan saat ini. Selain itu, RelPose++ juga mampu memprediksi translasi kamera untuk menghasilkan posisi kamera 6D.

Namun, ada masalah yang harus diatasi dalam penggunaan RelPose++, yaitu koordinat dunia yang digunakan untuk mendefinisikan ekstrinsik kamera dapat dipilih secara sembarangan. Solusi yang diusulkan oleh tim peneliti adalah dengan menyediakan koordinat dunia yang berpusat pada titik pertemuan sumbu optik kamera untuk gambar-gambar yang menghadap ke tengah. Hal ini bertujuan untuk memisahkan tugas prediksi rotasi dan translasi kamera.

Dalam pengujian empiris, tim peneliti menunjukkan bagaimana posisi kamera 6D yang dihasilkan oleh RelPose++ dapat memberikan manfaat langsung bagi teknik rekonstruksi 3D yang menggunakan pandangan terbatas (sparse-view) di masa depan. RelPose++ menawarkan metodologi baru yang bisa menjadi alternatif bagi industri yang membutuhkan teknologi ini, seperti para pelaku usaha online marketplace yang membutuhkan gambar produk dalam jumlah yang banyak dan terbatas hanya pada beberapa foto.

Teknologi ini menjanjikan kemajuan pesat dalam memulihkan posisi 6D dari gambar 2D. Seiring dengan perkembangan teknologi AI dan pengolahan gambar, metode ini menjadi alternatif yang dapat membantu para pelaku bisnis dalam meningkatkan kualitas dan jumlah gambar produk secara efektif dan efisien.

Disarikan dari: Sumber