Liputan6.com, Jakarta - OpenAI sebagai pembesut ChattGPT telah mengumumkan kehadiran model AI yang mampu mengubah perintah teks menjadi video. Model baru ini diberi nama Sora.
Kendati demikian, saat memperkenalkan Sora pada Februari 2024, OpenAI tidak mengungkap kapan model AI ini akan terbaru. Namun dari wawancara terbaru CTO OpenAI Mira Murati, jadwal kehadiran model AI ini mulai sedikit terungkap.
Baca Juga
Mengutip informasi dari GSM Arena, Jumat (15/3/2024), Mira mengungkap kehadiran Sore hanya dalam hitungan bulan. Ia menuturkan, Sore akan dirilis pada akhir 2024.
Advertisement
Meski masih terbilang beberapa bulan lagi, hal ini tentu dinantikan para pengguna yang ingin menjajalnya. Terlebih berdasarkan Mira, Sora memiliki biaya lebih mahal jika dibandingkan dengan model AI lain.
Walaupun demikian, OpenAi ingin membuatnya hadir dengan biaya yang tidak jauh berbeda dari DALL-E. Dijelaskan pula, video yang akan dibuat dengan Sora akan diberi watermark, dan tidak diizinkan membuat video tokoh publik.
Untuk diketahui, Sora bisa menciptakan adegan realistis dan imaginatif dari perintah teks. Model teks-ke-video memungkinkan pengguna membuat video fotorealistik berdurasi hingga satu menit.
Blog OpenAI menyebutkan, "Sora bisa menciptakan, adegan kompleks dengan banyak karakter, jenis gerakan tertentu, dan detail subjek serta latar belakang yang akurat."
Tidak hanya itu, pembuat ChatGPT ini juga menyebut, model AI tersebut bisa memahami cara objek ada di dunia fisik serta menafsirkan properti secara akurat dan menghasilkan karakter yang mengekspresikan emosi.
Kemampuan Sora dari OpenAI
Model AI juga diklaim mampu menghasilkan video berdasarkan gambar-gambar diam atau still image. Sora juga dikatakan mampu mengisi frame yang hilang pada video yang ada atau memperluasnya.
Demo yang dibuat oleh Sora pun disertakan dalam unggahan blog OpenAI, mencakup pemandangan udara California. Video tersebut seolah diambil dari dalam kereta Tokyo.
Meski begitu, masih ada tanda-tanda kalau video tersebut adalah video buatan AI. Misalnya lantai bergerak secara aneh dalam video museum.
Terkait hal ini, OpenAI mengatakan, model AI mereka kemungkinan kesulitan dalam mensimulasikan tampilan fisik yang akurat pada pemandangan yang sifatnya kompleks. Meski begitu, hasilnya masih tetap mengesankan.
Perlu diketahui, beberapa tahun lalu, generator teks ke gambar seperti Midjourney berada di garis depan dalam kemampuan model untuk mengubah teks menjadi gambar.
Advertisement
Kemampuan Ubah Teks Jadi Video Meningkat Pesat
Namun, baru-baru ini kemampuan mengubah teks jadi video meningkat dengan pesat. Misalnya, perusahaan seperti Runway dan Pika belum lama menunjukkan model teks-ke-video mereka yang mengesankan.
Selain itu, Lumiere Google juga menjadi salah satu pesaing utama OpenAI untuk bidang generator teks menjadi video.
Mirip dengan Sora, Lumiere memberikan tool teks-ke-video dan memungkinkan pengguna untuk membuat video dari gambar diam.
Baru Tersedia untuk Pengguna Tertentu
Bicara tentang Sora, saat ini model AI ini hanya tersedia pada pengguna-pengguna tertentu yang bertugas untuk menilai potensi bahaya dan risiko pada model tersebut.
OpenAI pun menawarkan akses Sora ke beberapa seniman visual, desainer, dan pembuat film untuk mendapatkan masukan.
Laporan ini mencatat, model yang ada mungkin tak secara akurat mensimulasikan hal-hal kompleks. Selain itu, Sora mungkin tidak bisa menafsirkan sebuah kejadian sebab akibat dengan tepat.
Advertisement