Google Kembangkan Kecerdasan Buatan untuk Bantu Orang dengan Hambatan Bicara

Parrotron memanfaatkan teknologi kecerdasan buatan end-to-end yang dilatih untuk mengubah ujaran seseorang dengan hambatan menjadi ujaran "fasih"

oleh M Hidayat diperbarui 19 Jul 2019, 08:00 WIB
Ilustrasi Kecerdasan Buatan. Dok: intersystems.com

Liputan6.com, Jakarta - Para ilmuwan di Google tengah berupaya untuk menyediakan solusi bagi orang-orang yang mengalami hambatan bicara. Solusi ini didukung oleh teknologi kecerdasan buatan.

Melalui proyek bernama Parrotron, mereka sedang melangsungkan penelitian yang bertujuan untuk membuat bahasa atipikal, yang biasa diujarkan oleh orang dengan hambatan bicara, menjadi lebih mudah dipahami. Atipikal sendiri berarti "tidak sesuai dengan jenis yang biasa atau pola yang diharapkan."

"Parrotron memudahkan pengguna dengan ujaran yang tidak biasa untuk diajak bicara dan dipahami oleh orang lain dan melalui antarmuka pembicaraan, dengan pendekatan konversi ujaran end-to-end, lebih memungkinkan untuk mereproduksi ujaran yang dimaksudkan pengguna," kata Fadi Biadsy dan Ron Weiss dalam tulisan blog resmi Google AI, sebagaimana dikutip dari Venture Beat, Jumat (10/7/2019).

Parrotron memanfaatkan teknologi kecerdasan buatan end-to-end yang dilatih untuk mengubah ujaran seseorang dengan hambatan menjadi ujaran "fasih". Teknologi ini hanya mempertimbangkan sinyal ujaran ketimbang isyarat visual seperti gerak bibir.

 


Dua Fase

Selain itu, teknologi ini dilatih dalam dua fase yang menggunakan korpora paralel. Di dalam ilmu bahasa, korpora (bentuk jamak dari korpus) merupakan "kumpulan ujaran yang tertulis atau lisan yang digunakan untuk menyokong atau menguji hipotesis tentang struktur bahasa."

Fase pertama menggunakan korpus berdurasi sekitar 30.000 jam yang terdiri dari jutaan pasangan ujaran anonim. Setiap pasangan ujaran menyertakan ujaran alami yang dipasangkan dengan ujaran yang disintesis secara otomatis.

Fase kedua menggunakan kumpulan pasangan ujaran yang dihasilkan dengan cara yang sama seperti dataset pertama.

Namun, di fase kedua ini, korpus digunakan untuk mengadaptasi jaringan ke pola akustik/fonetik, fonotaktik dan bahasa tertentu. Hal itu termasuk bagaimana ujaran mengubah, mengganti, dan mengurangi atau menghilangkan vokal atau konsonan tertentu.

(Why/Isk)

Rekomendasi

POPULER

Berita Terkini Selengkapnya