Liputan6.com, Jakarta - Pembesut ChatGPT, OpenAI, meluncurkan model AI yang mampu mengubah perintah teks menjadi video. Model AI tersebut dinamai Sora.
Advertisement
OpenAI menyebut, Sora bisa menciptakan adegan realistis dan imaginatif dari perintah teks. Model teks-ke-video memungkinkan pengguna membuat video fotorealistik berdurasi hingga satu menit, semua berdasarkan perintah tertulis.
Mengutip The Verge, Jumat (16/2/2024), blog OpenAI menyebutkan, "Sora bisa menciptakan, adegan kompleks dengan banyak karakter, jenis gerakan tertentu, dan detail subjek serta latar belakang yang akurat."
Bahkan, pembuat ChatGPT juga mencatat, model AI tersebut bisa memahami bagaimana objek ada di dunia fisik serta menafsirkan properti secara akurat dan menghasilkan karakter yang mengekspresikan emosi.
Model AI juga diklaim mampu menghasilkan video berdasarkan gambar-gambar diam atau still image. Sora juga dikatakan mampu mengisi frame yang hilang pada video yang ada atau memperluasnya.
Demo yang dibuat oleh Sora pun disertakan dalam unggahan blog OpenAI, mencakup pemandangan udara California. Video tersebut seolah diambil dari dalam kereta Tokyo.
Masih Ada Tanda Kalau Video Besutan AI
Meski begitu, masih ada tanda-tanda kalau video tersebut adalah video buatan AI. Misalnya lantai bergerak secara aneh dalam video museum.
Terkait hal ini, OpenAI mengatakan, model AI mereka kemungkinan kesulitan dalam mensimulasikan tampilan fisik yang akurat pada pemandangan yang sifatnya kompleks. Meski begitu, hasilnya masih tetap mengesankan.
Perlu diketahui, beberapa tahun lalu, generator teks ke gambar seperti Midjourney berada di garis depan dalam kemampuan model untuk mengubah teks menjadi gambar.
Advertisement
Kemampuan Ubah Teks Jadi Video Meningkat Pesat
Namun, baru-baru ini kemampuan mengubah teks jadi video meningkat dengan pesat. Misalnya, perusahaan seperti Runway dan Pika belum lama menunjukkan model teks-ke-video mereka yang mengesankan.
Selain itu, Lumiere Google juga menjadi salah satu pesaing utama OpenAI untuk bidang generator teks menjadi video.
Mirip dengan Sora, Lumiere memberikan tool teks-ke-video dan memungkinkan pengguna untuk membuat video dari gambar diam.
Baru Tersedia untuk Pengguna Tertentu
Bicara tentang Sora, saat ini model AI ini hanya tersedia pada pengguna-pengguna tertentu yang bertugas untuk menilai potensi bahaya dan risiko pada model tersebut.
OpenAI pun menawarkan akses Sora ke beberapa seniman visual, desainer, dan pembuat film untuk mendapatkan masukan.
Laporan ini mencatat, model yang ada mungkin tak secara akurat mensimulasikan hal-hal kompleks. Selain itu, Sora mungkin tidak bisa menafsirkan sebuah kejadian sebab akibat dengan tepat.
Advertisement