Liputan6.com, Jakarta - OpenAI dan Google melatih model AI besutannya pada teks yang ditranskripsi dari video YouTube. Cara ini berpotensi melanggar hak cipta pembuat konten.
Hal ini terjadi hanya beberapa hari setelah CEO YouTube Neal Mohan mengatakan dalam sebuah wawancara dengan Bloomberg Originals bahwa dugaan penggunaan video YouTube oleh OpenAI untuk melatih generator teks-ke-video barunya, Sora, bisa melanggar kebijakan platform.
Advertisement
Menurut laporan New York Times, OpenAI menggunakan alat pengenalan ucapan Whisper untuk menyalin lebih dari satu juta jam video YouTube, yang kemudian digunakan untuk melatih GPT-4.
Informasi sebelumnya melaporkan OpenAI telah menggunakan video dan podcast YouTube untuk melatih kedua sistem AI tersebut. Presiden OpenAI Greg Brockman dilaporkan termasuk di antara orang-orang yang tergabung dalam tim ini.
"Sesuai aturan Google, pengambilan atau pengunduhan konten YouTube secara tak sah tidak diperbolehkan," kata Juru Bicara Google, Matt Bryant kepada New York Times.
Bryant mengklaim bahwa perusahaan tidak mengetahui adanya penggunaan semacam itu oleh OpenAI.
Namun laporan tersebut mengklaim ada orang-orang di Google yang mengetahuinya, tetapi tidak mengambil tindakan terhadap OpenAI karena Google juga menggunakan video YouTube untuk melatih model AI-nya sendiri.
Google Minta Ubah Kebijakan Privasi
Google mengatakan kepada New York Times bahwa mereka hanya melakukannya pada video dari pembuat konten yang telah menyetujui hal ini.
Laporan itu juga mengklaim Google meminta tim untuk mengubah kebijakan privasinya pada Juni 2023 agar mencakup penggunaan konten yang tersedia untuk umum secara lebih luas, termasuk Google Docs dan Google Sheets, untuk melatih model dan produk AI-nya.
Perubahan tersebut, yang menurut Google dilakukan demi kejelasan, dipublikasikan pada Juli 2023.
Bryant mengatakan kepada New York Times bahwa jenis data ini hanya digunakan dengan izin dari pengguna yang ikut serta dalam pengujian fitur eksperimental Google.
Perusahaan juga tidak melakukan pelatihan tentang jenis data tambahan berdasarkan perubahan bahasa. Perubahan tersebut menambahkan chatbot AI Bard sebagai contoh penggunaan data tersebut.
Advertisement
Makin Ngeri, OpenAI Bisa Kloning Suara Manusia Cuma dari Sampel Audio 15 Detik
Sebelumnya, OpenAI mengumumkan telah melakukan pratinjau skala kecil dari alat baru yang disebut Voice Engine, teknologi kloning suara yang dapat meniru pembicara mana pun (manusia) dengan cara menganalisis sampel audio berdurasi 15 detik.
Perusahaan pembesut chatbit AI ChatGPT ini mengatakan mereka menghasilkan 'ucapan yang terdengar alami' dengan 'suara yang emosional dan realistis'.
Mengutip Engadget, Minggu (31/3/2024), teknologi ini didasarkan pada API text-to-speech milik OpenAI yang sudah ada dan telah digunakan sejak tahun 2022.
OpenAI telah menggunakan versi perangkat untuk mendukung suara preset yang tersedia di API text-to-speech saat ini dan fitur Read Aloud.
Ada banyak contoh kloning suara manusia di blog resmi perusahaan dan kedengarannya sangat mirip dengan aslinya. Kalau kamu penasaran, cobalah untuk mendengarkannya dan membayangkan sejumlah kemungkinan yang terjadi, baik atau buruk.
OpenAI mengatakan mereka melihat teknologi ini berguna untuk bantuan membaca, terjemahan bahasa, dan membantu mereka yang memiliki kondisi bicara mendadak atau degeneratif.
Perusahaan tersebut meluncurkan program percontohan Brown University yang membantu pasien dengan masalah gangguan bicara dengan membuat tiruan Voice Engine yang diambil dari rekaman audio untuk proyek sekolah.
Risiko Penyalahgunaan
Terlepas dari potensi manfaatnya, pelaku kejahatan pasti akan menyalahgunakan teknologi ini untuk melakukan tindakan jahat, dan hal ini sudah menjadi masalah.
Terkait hal itu, Voice Engine belum siap untuk tayang perdana, karena ada masalah privasi serius yang harus dipenuhi sebelum peluncuran penuh.
OpenAI mengakui bahwa teknologi ini memiliki risiko serius, khususnya telah menjadi perhatian utama pada tahun pemilu.
Perusahaan menyatakan akan mempertimbangkan masukan dari “mitra AS dan internasional dari seluruh pemerintahan, media, hiburan, pendidikan, masyarakat sipil, dan lainnya” untuk memastikan peluncuran produk dengan risiko minimal.
Semua penguji pratinjau menyetujui kebijakan penggunaan OpenAI, yang melarang peniruan identitas individu lain tanpa izin atau hak hukum.
Selain itu, siapa pun yang menggunakan teknologi ini harus mengungkapkan kepada audiensnya bahwa suara tersebut dihasilkan oleh AI.
Advertisement
Langkah Keamanan OpenAI
OpenAI menerapkan langkah-langkah keamanan, seperti pemberian watermark untuk melacak asal audio apa pun dan “pemantauan proaktif” tentang cara sistem digunakan.
Saat produk resmi diluncurkan, akan ada “daftar suara terlarang” yang mendeteksi dan mencegah pembicara buatan AI yang terlalu mirip dengan tokoh terkemuka.
Mengenai kapan peluncuran ini akan dilakukan, OpenAI masih bungkam. TechCrunch menemukan beberapa data harga potensial dan sepertinya akan melemahkan pesaing seperti ElevenLabs.
Voice Engine bisa berharga USD 15 per satu juta karakter, yang berarti sekitar 162.500 kata.
Ini tentu terdengar seperti cara yang ramah budget untuk menyelesaikan buku audio. Materi pemasaran juga merujuk pada versi “HD” yang harganya dua kali lipat, namun perusahaan belum merinci cara kerjanya.
OpenAI telah membuat langkah besar minggu ini. Mereka baru saja mengumumkan kemitraan lain dengan sahabatnya Microsoft untuk membangun superkomputer berbasis AI yang disebut “Stargate.”
Menurut informasi yang diwartakan The Information, proyek ini dilaporkan akan menelan biaya USD 100 miliar.
Infografis Geger Akun Penyebar Hoaks di YouTube. (Liputan6.com/Trieyasni)
Advertisement