Liputan6.com, Jakarta - Google mengumumkan Project Unison akan menggandeng Fakultas Ilmu Budaya Universitas Gadjah Mada (FIB UGM) dalam mengumpulkan rekaman tuturan bahasa Jawa. Tujuannya untuk membuat model bahasa yang lebih baik bagi orang Indonesia yang menggunakan produk-produk Google.
Project Unison merupakan proyek penelitian Google untuk membuat suara text-to-speech secara lebih cepat, murah, dan efisien untuk bahasa dengan sumber daya terbatas.
Baca Juga
Advertisement
Di masa lalu, membuat suara text-to-speech (TTS) yang cukup layak untuk bahasa dengan sumber daya terbatas, sulit dilakukan. Penyebabnya bukan hanya karena biaya yang tinggi, tetapi juga karena besarnya data audio yang diperlukan.
Namun, kemajuan teknologi machine learning telah memungkinkan Google membuat model suara dengan data yang sangat terbatas. Google kini dapat mengumpulkan sampel suara hanya dengan perangkat seharga US$2.000 (komputer, mikrofon, USB converter, dan preamplifier).
Selama beberapa pekan ke depan, rekaman audio penutur bahasa Jawa di Yogyakarta akan digabungkan guna membuat suara berbahasa Jawa pertama di dunia untuk smartphone Android. Hal ini memungkinkan penutur bahasa Jawa menggunakan masukan suara (voice input) pada smartphone serta mendengarkan smartphone membacakan kembali teks dalam bahasa Jawa (text-to-speech).
Dengan demikian, 80 juta penutur bahasa Jawa di Indonesia akan dapat berinteraksi dengan smartphone mereka secara lebih alami dan mendorong mereka untuk lebih mengembangkan budaya Jawa di Internet.
Terhitung mulai awal Mei, FIB UGM akan menyediakan ruangan dan peserta pengumpulan data suara. Google juga akan bekerja sama dengan Universitas Reykjavik untuk bahasa dengan sumber daya terbatas dalam usaha untuk memasukkan lebih banyak bahasa ke online dan membuat alat yang tersedia melalui open source untuk mendukung penelitian dan pengembangan.
Selama di UGM, peneliti Google akan mengajarkan pengembang lokal dan mahasiswa cara menggunakan teknologi dan data Google yang dapat diakses secara terbuka, dan mengajak banyak orang dari berbagai penjuru Indonesia untuk mengikuti workshop.
Data suara berbahasa Jawa yang akan dikumpulkan dalam beberapa pekan ke depan dapat diakses secara terbuka, sehingga kelak pengembang dan peneliti di kampus-kampus di Indonesia dapat mengembangkan teknologi berbahasa Jawa sendiri.
(Why/Ysl)