Liputan6.com, Jakarta - Meta meluncurkan AudioCraft, sebuah alat berbasis kecerdasan buatan atau artificial intelligence (AI) open-source, yang memudahkan pengguna membuat musik hanya dengan deskripsi teks.
AudioCraft mencakup tiga model AI yaitu MusicGen, AudioGen, dan EnCodec. MusicGen dilatih dengan musik milik Meta dan berlisensi khusus, untuk menghasilkan musik dari prompt teks.
Baca Juga
Sementara AudioGen, yang dilatih dengan efek suara publik, menghasilkan audio juga dari prompt teks.
Advertisement
Sementara, seperti mengutip blog resmi Meta, Sabtu (5/8/2023), EnCodec memungkinkan pembuatan musik berkualitas tinggi dengan artefak yang lebih sedikit.
Meta juga merilis model AudioGen terlatih mereka, yang memungkinkan pengguna menghasilkan suara lingkungan dan efek suara seperti gonggongan anjing, klakson mobil, atau langkah kaki di lantai kayu.
Meta pun mengumumkan mereka membagikan seluruh bobot dan kode model AudioCraft.
"Kami membuat model open-source ini, memberi peneliti dan praktisi akses sehingga mereka dapat melatih model mereka sendiri dengan kumpulan data mereka sendiri untuk pertama kalinya," tulis Meta.
"Dan membantu memajukan bidang audio dan musik yang dihasilkan AI," imbuh perusahaan induk Facebook itu.
Menurut Meta, sektor audio "sedikit tertinggal" soal AI generatif bila dibandingkan dengan gambar, video, maupun teks.
Perusahaan menyebut, ada pekerjaan-pekerjaan yang sangat rumit dan tidak terlalu terbuka, sehingga orang tidak dapat dengan mudah memainkannya.
"Menghasilkan audio fidelitas tinggi dalam bentuk apa pun memerlukan pemodelan sinyal dan pola yang kompleks pada berbagai skala," kata induk Facebook itu.
Dapat Hasilkan Audio Berkualitas Tinggi
"Musik bisa dibilang merupakan jenis audio yang paling menantang untuk dihasilkan karena terdiri dari pola lokal dan jarak jauh, dari rangkaian nada hingga struktur musik global dengan berbagai instrumen," kata Meta.
Meta mengklaim, rangkaian model AudioCraft dapat menghasilkan audio berkualitas tinggi dengan konsistensi jangka panjang, serta dapat dengan mudah digunakan.
"AudioCraft berfungsi untuk musik, suara, kompresi, dan pembuatan — semuanya di tempat yang sama," kata Meta.
"Memiliki fondasi open source yang solid akan mendorong inovasi dan melengkapi cara kami memproduksi dan mendengarkan audio dan musik di masa mendatang," tulis mereka lebih lanjut.
Soal hak cipta, Meta mengklaim bahwa model yang sudah dilatih sebelumnya semuanya memakai materi publik atau yang sudah dimiliki oleh perusahaan.
Ini bukan satu-satunya alat AI teks ke audio satu-satunya. Sebelumnya, Google juga memperkenalkan model MusicLM.
Advertisement
Google Kembangkan MusicLM, Bisa Ubah Teks jadi Musik
Diketahui, Google sedang mengembangkan aplikasi AI eksperimental yang memungkinkan pengguna mengubah ide mereka menjadi musik berdasarkan deskripsi teks, yakni MusicLM.
Berdasarkan informasi yang dikutip dari Android Police, Kamis (1/6/2023), konsep MusicLM tidak jauh berbeda dengan cara kerja chatbot Google atau Microsoft yang memberikan respons sesuai perintah pengguna.
Melalui blog resminya, Product Manager of Labs, Kristin Yim, dan Product Manager of Google Research, Hema Manickavasagam, mengumumkan bahwa pendaftaran untuk MusicLM telah dimulai.
Aplikasi ini disebut sebagai alat eksperimental yang dapat mengubah perintah teks menjadi musik. Misalnya, ketika pengguna mengetik “Soulful jazz untuk makan malam,” alat akan menghasilkan musik sesuai deskripsi.
Blog tersebut juga menjelaskan, MusicLM akan mengirimkan dua versi musik dan pengguna dapat memilih salah satunya yang lebih disukai. Hal ini dilakukan untuk membantu model AI meningkatkan kemampuannya dalam menghasilkan musik.
Kendati demikian, Google juga telah mengantisipasi kekhawatiran yang serupa dengan alat AI lainnya, yaitu penyalahgunaan yang merugikan artis. Google mengklaim telah berupaya menjadikan alatnya sebagai "inovasi yang bertanggung jawab."
Kerja Sama dengan Musisi
Untuk menciptakan alat yang sesuai dengan visi tersebut, Google mengatakan perusahaan bekerja sama dengan sejumlah musisi. "Kami percaya inovasi yang bertanggung jawab tidak terjadi secara terpisah."
"Kami telah bekerja sama dengan musisi seperti Dan Deacon dan menyelenggarakan lokakarya untuk melihat bagaimana teknologi ini dapat memberdayakan proses kreatif,” tulis perusahaan dalam blog resminya.
Untuk mendukung penelitian di masa mendatang, Google pun merilis MusicCaps secara publik, yakni kumpulan data berisi sekitar 5 ribu pasangan musik dan teks, dengan deskripsi teks yang disediakan oleh para pakar.
Menurut Google, MusicLM dapat membantu pengguna mengekspresikan kreativitas, baik sebagai seorang musisi pemula maupun profesional.
(Dio/Dam)
Advertisement