Makin Ngeri, OpenAI Bisa Kloning Suara Manusia Cuma dari Sampel Audio 15 Detik

Liputan6.com, Jakarta - OpenAI mengumumkan telah melakukan pratinjau skala kecil dari alat baru yang disebut Voice Engine, teknologi kloning suara yang dapat meniru pembicara mana pun (manusia) dengan cara menganalisis sampel audio berdurasi 15 detik.

Perusahaan pembesut chatbit AI ChatGPT ini mengatakan mereka menghasilkan 'ucapan yang terdengar alami' dengan 'suara yang emosional dan realistis'.

Mengutip Engadget, Minggu (31/3/2024), teknologi ini didasarkan pada API text-to-speech milik OpenAI yang sudah ada dan telah digunakan sejak tahun 2022.

OpenAI telah menggunakan versi perangkat untuk mendukung suara preset yang tersedia di API text-to-speech saat ini dan fitur Read Aloud.

Ada banyak contoh kloning suara manusia di blog resmi perusahaan dan kedengarannya sangat mirip dengan aslinya. Kalau kamu penasaran, cobalah untuk mendengarkannya dan membayangkan sejumlah kemungkinan yang terjadi, baik atau buruk.

OpenAI mengatakan mereka melihat teknologi ini berguna untuk bantuan membaca, terjemahan bahasa, dan membantu mereka yang memiliki kondisi bicara mendadak atau degeneratif.

Perusahaan tersebut meluncurkan program percontohan Brown University yang membantu pasien dengan masalah gangguan bicara dengan membuat tiruan Voice Engine yang diambil dari rekaman audio untuk proyek sekolah.

2 dari 4 halaman

Risiko Penyalahgunaan

Terlepas dari potensi manfaatnya, pelaku kejahatan pasti akan menyalahgunakan teknologi ini untuk melakukan tindakan jahat, dan hal ini sudah menjadi masalah.

Terkait hal itu, Voice Engine belum siap untuk tayang perdana, karena ada masalah privasi serius yang harus dipenuhi sebelum peluncuran penuh.

OpenAI mengakui bahwa teknologi ini memiliki risiko serius, khususnya telah menjadi perhatian utama pada tahun pemilu.

Perusahaan menyatakan akan mempertimbangkan masukan dari “mitra AS dan internasional dari seluruh pemerintahan, media, hiburan, pendidikan, masyarakat sipil, dan lainnya” untuk memastikan peluncuran produk dengan risiko minimal.

Semua penguji pratinjau menyetujui kebijakan penggunaan OpenAI, yang melarang peniruan identitas individu lain tanpa izin atau hak hukum.

Selain itu, siapa pun yang menggunakan teknologi ini harus mengungkapkan kepada audiensnya bahwa suara tersebut dihasilkan oleh AI.

3 dari 4 halaman

Langkah Keamanan OpenAI

Ilustrasi ChatGPT, chatbot AI generatif yang mampu ciptakan malware canggih. (unsplash/Choong Deng Xiang)

OpenAI menerapkan langkah-langkah keamanan, seperti pemberian watermark untuk melacak asal audio apa pun dan “pemantauan proaktif” tentang cara sistem digunakan.

Saat produk resmi diluncurkan, akan ada “daftar suara terlarang” yang mendeteksi dan mencegah pembicara buatan AI yang terlalu mirip dengan tokoh terkemuka.

Mengenai kapan peluncuran ini akan dilakukan, OpenAI masih bungkam. TechCrunch menemukan beberapa data harga potensial dan sepertinya akan melemahkan pesaing seperti ElevenLabs.

Voice Engine bisa berharga USD 15 per satu juta karakter, yang berarti sekitar 162.500 kata.

Ini tentu terdengar seperti cara yang ramah budget untuk menyelesaikan buku audio. Materi pemasaran juga merujuk pada versi “HD” yang harganya dua kali lipat, namun perusahaan belum merinci cara kerjanya.

OpenAI telah membuat langkah besar minggu ini. Mereka baru saja mengumumkan kemitraan lain dengan sahabatnya Microsoft untuk membangun superkomputer berbasis AI yang disebut “Stargate.”

Menurut informasi yang diwartakan The Information, proyek ini dilaporkan akan menelan biaya USD 100 miliar.

4 dari 4 halaman