Israel Kembangkan Teknologi Perangkum Teks Multibahasa, Hasilnya Mirip Manusia

Teknologi baru untuk merangkum teks multibahasa secara otomatis tengah dikembangkan para peneliti Israel.

oleh Liputan6.com diperbarui 29 Nov 2019, 18:35 WIB
Bendera Israel berkibar di dekat Gerbang Jaffa di Kota Tua Yerusalem (20/3). Gerbang Jaffa adalah sebuah portal yang dibuat dari batu yang berada dalam deret tembok bersejarah Kota Lama Yerusalem. (AFP Photo/Thomas Coex)

Liputan6.com, Jakarta - Teknologi baru untuk merangkum teks multibahasa secara otomatis tengah dikembangkan para peneliti Israel. Metode itu diberi nama MUSE (multilingual sentence extractor) atau pengekstrak kalimat multibahasa.

Menurut laporan Universitas Ben-Gurion di Israel selatan, teknologi ini telah diuji dalam sembilan bahasa, yaitu Mandarin, Inggris, Ibrani, Arab, Persia, Rusia, Jerman, Prancis dan Spanyol.

Ringkasan hasil uji coba yang dibuat oleh teknologi baru ini menunjukkan banyak kemiripan dengan yang ditulis manusia.

Dengan meningkatnya teks daring dalam jumlah yang sangat banyak, timbul kebutuhan akan metode otomatis untuk merangkum file teks, seperti artikel atau wawancara, guna diproses lebih lanjut.

Pada saat yang sama, seperti dikutip dari Xinhua, Jumat (29/11/2019), tidak banyak waktu yang tersedia untuk membaca keseluruhan teks tersebut, sehingga diperlukan metode otomatis untuk meringkasnya.

 

Saksikan video pilihan di bawah ini:


Jadi Sebuah Sinopsis

Ilustrasi Bendera Israel dan Yerusalem (AFP)

Namun, kebanyakan metode otomatis yang tersedia saat ini bergantung pada bahasa, dan algoritme yang mendasarinya harus menjalani pelatihan awal untuk mempelajari teks dalam jumlah besar.

Metode baru ini menyediakan ringkasan teks dalam berbagai bahasa yang berbeda, berdasarkan pada sebuah algoritma yang mengukur skala kalimat dalam sebuah dokumen, menggunakan karakteristik statistik dari kalimat tersebut.

Pemeringkatan ini dapat dilakukan pada kalimat dalam bahasa apa pun, lalu mengekstrak kalimat tingkat tinggi menjadi sebuah sinopsis.

Serangkaian uji coba menunjukkan bahwa setelah pelatihan awal algoritma pada korpus beranotasi dari dokumen yang dirangkum, perangkat lunak itu tidak perlu dilatih ulang pada korpus rangkuman dalam setiap bahasa baru, dan model pemeringkatan kalimat yang sama dapat digunakan di beberapa bahasa.

"Alat ini akan menjadi tambahan yang berharga untuk mendapatkan manfaat dari sejumlah besar teks yang tersedia secara daring," demikian disimpulkan para peneliti.

POPULER

Berita Terkini Selengkapnya