Model AI Facebook Terjemahkan 100 Bahasa tanpa Bergantung pada Data Bahasa Inggris

Facebook AI memperkenalkan M2M-100 sebagai model Machine Translation multibahasa pertama yang dapat menerjemahkan 100 pasang bahasa apa pun tanpa bergantung pada bahasa Inggris

oleh M Hidayat diperbarui 27 Okt 2020, 09:00 WIB
Ilustrasi Kecerdasan Buatan. Kredit: Geralts via Pixabay

Liputan6.com, Jakarta - Facebook AI memperkenalkan M2M-100 sebagai model Machine Translation multibahasa pertama yang dapat menerjemahkan 100 pasang bahasa apa pun tanpa bergantung pada bahasa Inggris.

Umumnya pendekatan sistem Machine Translation memerlukan pembuatan model kecerdasan buatan terpisah untuk setiap bahasa dan setiap task.

Misalnya, saat melakukan penerjemahan dari bahasa China ke Prancis, model kecerdasan buatan multibahasa yang sudah ada sebelumnya perlu melatih bahasa China ke Inggris terlebih dahulu, lalu melatih bahasa Inggris ke Prancis. Hal ini disebabkan oleh training data bahasa Inggris paling banyak tersedia.

Namun, pendekatan ini tidak berlaku efektif di Facebook, di mana penggunanya menuliskan konten dalam lebih dari 160 bahasa dalam miliaran pos.

Hal itulah yang mendorong Facebook AI mengembangkan sebuah model kecerdasan buatan yang dapat melatih data bahasa sumber ke bahasa target secara langsung untuk lebih menjaga makna hasil terjemahan.

Model Machine Translation ini juga disebut mengungguli sistem lain yang bergantung pada bahasa Inggris. Ia tersedia secara open-source di repositori di Github.

Saksikan video pilihan di bawah ini


Facebook Rilis Fitur Caption Otomatis untuk Live Video dengan Dukungan AI

Facebook Rilis Fitur Caption Otomatis untuk Video Langsung. Kredit: Facebook

Dalam beberapa bulan terakhir selama pandemi Covid-19, audiens siaran berita dan arahan pemerintah meningkat signifikan. Di berbagai platform, termasuk Facebook, publik mencari informasi aktual tentang pandemi, panduan perjalanan, dan hal lainnya.

Namun, tidak semua orang dapat mengakses informasi ini. Menurut Organisasi Kesehatan Dunia, lebih dari 5 persen populasi dunia--sekitar 466 juta orang--mengalami gangguan pendengaran.

Pada tahun 2050 mendatang, angka itu diproyeksikan meningkat menjadi lebih dari 900 juta.

"Caption di video sangat penting bagi orang-orang seperti saya di komunitas tuna rungu dalam keadaan darurat kesehatan masyarakat," kata Brenden Gilbert, Production Operations Engineer di Facebook, dikutip dari keterangan perusahaan.

Memang, Facebook sudah lebih dulu menyediakan caption otomatis untuk video on-demand dalam 16 bahasa dan baru saja mengumumkan kemampuan serupa di IGTV. Namun, kebutuhan akan akses terhadap berita dan informasi langsung dan real-time masih perlu dipenuhi.

Hal ini yang mendorong para peneliti dan insinyur di Facebook AI untuk membuat konten video lebih aksesibel dengan caption otomatis untuk Facebook Live dan Workplace Live.


Dukungan Bahasa

Dukungan BahasaFitur tersebut untuk saat ini mendukung enam bahasa, yakni Inggris, Spanyol, Portugis, Italia, Jerman, dan Prancis.

Teknologi caption otomatis, yang telah ada sejak akhir 2000-an, masih merupakan pekerjaan sulit. Dalam jenis percakapan di tayangan langsung (live stream), orang tidak selalu berbicara secara alami dengan jelas atau menunggu giliran untuk berbicara.

Kebisingan di latar belakang, variasi aksen dan dialek, dan rentang nada luas yang memengaruhi ucapan manusia, membuat hal ini semakin sulit.

Sistem juga perlu belajar mengenali ratusan juta kata berbeda dalam banyak bahasa, termasuk nama dan jargon tidak umum.

POPULER

Berita Terkini Selengkapnya