GenMM: Model AI Untuk Membuat Boneka Digital Dari Satu Contoh Gerakan

Kemajuan dalam animasi yang dihasilkan komputer semakin hari semakin realistis. Perkembangan ini dapat terlihat dengan jelas dalam dunia permainan video. Bayangkanlah karakter Lara Croft dalam seri Tomb Raider, dari marionet dengan 230 poligon yang bergerak aneh-aneh menjadi karakter yang mirip dengan kehidupan nyata yang bergerak dengan lancar di layar kita.

Namun, pembuatan animasi komputer yang alami dan beragam telah lama menjadi masalah yang sulit. Metode tradisional seperti sistem pemantau gerakan dan pembuatan animasi manual terkenal mahal dan memakan waktu, sehingga menghasilkan dataset gerakan yang terbatas dan kurang beragam dalam gaya, struktur rangka, dan jenis model. Sifat manual dan memakan waktu dari pembuatan animasi ini menciptakan kebutuhan akan solusi otomatis di industri.

Metode sintesis gerakan berbasis data yang ada saat ini memiliki keterbatasan dalam efektivitasnya. Namun, dalam beberapa tahun terakhir, deep learning muncul sebagai teknik yang kuat dalam animasi komputer, mampu menghasilkan gerakan yang beragam dan realistis ketika dilatih dengan dataset yang besar dan komprehensif.

Namun, metode deep learning memiliki beberapa kelemahan yang membatasi aplikabilitasnya dalam praktik. Pertama, metode tersebut membutuhkan waktu pelatihan yang lama, yang dapat menjadi hambatan signifikan dalam produksi animasi. Kedua, metode tersebut rentan terhadap artefak visual seperti goyang atau terlalu halus, yang mempengaruhi kualitas gerakan yang dihasilkan. Terakhir, metode tersebut sulit untuk diterapkan pada struktur rangka yang besar dan kompleks, yang membatasi penggunaannya dalam skenario yang memerlukan gerakan rumit.

Namun, sekarang ada solusi yang dapat mengatasi masalah-masalah tersebut, yaitu GenMM. GenMM adalah pendekatan alternatif berdasarkan ide klasik dari tetangga terdekat gerakan dan pencocokan gerakan. GenMM menggunakan pencocokan gerakan, teknik yang banyak digunakan dalam industri animasi karakter, dan menghasilkan animasi berkualitas tinggi yang terlihat alami dan beradaptasi dengan konteks lokal yang beragam.

GenMM adalah model generatif yang dapat mengekstraksi gerakan yang beragam dari satu atau beberapa contoh urutan. Hal ini dicapai dengan memanfaatkan database pemantauan gerakan yang luas sebagai representasi keseluruhan ruang gerakan alami. GenMM menggabungkan kesamaan berkebalikan sebagai fungsi biaya generatif baru. Ukuran kesamaan ini memastikan bahwa urutan gerakan yang disintesis hanya mengandung urutan gerakan dari contoh yang diberikan dan sebaliknya. Pendekatan ini menjaga kualitas pencocokan gerakan sambil memungkinkan kemampuan generatif. Untuk meningkatkan keragaman, GenMM menggunakan kerangka kerja multi-tahap yang secara progresif mensintesis urutan gerakan dengan perbedaan distribusi minimal dibandingkan dengan contoh-contoh tersebut. Selain itu, input noise tanpa syarat diperkenalkan dalam pipa, terinspirasi oleh keberhasilan metode berbasis GAN dalam sintesis gambar, untuk mencapai hasil sintesis yang sangat beragam.

Selain kemampuannya untuk menghasilkan gerakan yang beragam, GenMM juga terbukti menjadi kerangka kerja yang serbaguna yang dapat diperluas ke berbagai skenario di luar kemampuan pencocokan gerakan semata. Ini termasuk pengisian gerakan, generasi berpandu kunci, pengulangan tak terbatas, dan penggabungan gerakan, yang menunjukkan berbagai aplikasi yang luas yang dimungkinkan oleh pendekatan pencocokan gerakan generatif.

GenMM menawarkan solusi yang inovatif dan efektif untuk masalah sintesis gerakan dalam animasi komputer. Dengan menggabungkan pendekatan pencocokan gerakan dengan metode generatif, GenMM mampu mengatasi keterbatasan metode deep learning dan menghasilkan animasi yang berkualitas tinggi dan bervariasi. Dengan kemampuannya untuk mengekstraksi gerakan dari contoh yang sedikit, GenMM juga menghemat waktu dan biaya dalam produksi animasi. Dengan keberhasilannya dalam berbagai skenario animasi, GenMM membuktikan dirinya sebagai pendekatan yang serbaguna dan inovatif dalam sintesis gerakan komputer.

Dengan kehadiran GenMM, industri animasi komputer dapat mengoptimalkan proses pembuatan animasi dengan menghasilkan gerakan yang alami dan beragam dalam waktu yang lebih singkat. Ini akan memberikan pengalaman yang lebih imersif bagi para pemain video game dan meningkatkan kualitas animasi dalam film dan acara televisi. Dengan kemampuannya untuk diperluas ke berbagai skenario, GenMM juga dapat digunakan dalam aplikasi lain seperti pengisian gerakan dan penggabungan gerakan. Dengan demikian, GenMM memiliki potensi besar untuk mengubah cara kita menciptakan dan mengkonsumsi animasi komputer.

Disarikan dari: Sumber