Indonesia menjadi negara dengan keberagaman bahasa terbanyak kedua di dunia setelah Papua Nugini. Namun, Kementerian Pendidikan, Kebudayaan, Riset, dan Teknologi mencatat adanya rapor merah pada bahasa daerah di Indonesia.
"Ada potensi bahasa daerah yg mulai punah. Tercatat sebanyak 24 bahasa daerah di Indonesia dengan 0 penutur bahasa. Hal ini tentu menjadi ancaman untuk bahasa daerah kita," kata Karlina Octaviany selaku AI (Artificial Intellegence) Advisor Fair Forward, GIZ Indonesia, di Gedung STP ITB, Bandung Senin (22/4/2024).
Karlina memaparkan, di tengah kehebohan publik dengan kemunculan AI dan chatgpt, teknologi tersebut dapat dimanfaatkan dalam penyelamatan bahasa daerah. Dalam langkah tersebut, GIZ Indonesia atas nama Kementerian Kerja sama Ekonomi dan Pembangunan Jerman (BMZ), bersama dengan Kementerian PPN/BAPPENAS Republik Indonesia telah meluncurkan tiga model AI bahasa daerah.
SCROLL TO CONTINUE WITH CONTENT
Dalam program FAIR Forward 'Artificial Intelligence for All', diciptakan metode AI dalam tiga bahasa daerah yakni Minangkabau, Bali, dan Bugis sebagai representasi bahasa di Indonesia. Penggunaan teknologi ini, kemudian bertujuan untuk dimanfaatkan dalam bidang industri dan penelitian.
"Hal ini sebagai langkah awal dan harapannya akan dikembangkan ke bahasa daerah lain. AI menjadi teknologi kunci dan membuka peluang baru agar teknologi Indonesia berkembang lebih pesat lagi. Proyek bersama Prosa AI ini menjadikan akses sumber data AI yang terbuka untuk diakses siapapun," ucapnya.
Langkah pengembangan sumber data AI diharapkan mampu mengatasi tantangan pembangunan di seluruh wilayah dan dunia. Ayu Purwarianti, Co-Founder Prosa.AI memaparkan bagaimana 108 anotator dikumpulkan dalam proyek teknologi kebahasaan ini.
"Kami mencari sosok yang betul-betul native speaker. Prosa.ai sebagai startup yang juga dibidangi oleh ITB merupakan perusahaan teknologi pemrosesan bahasa di Indonesia. Proyek ini merupakan gerakan open source untuk mendorong orang membuat sesuatu dan kita buka datanya. Sehingga semua orang bisa pakai," ucap Ayu.
Alasan pemilihan tiga bahasa daerah tersebut didasari dari ketiganya merupakan cabang bahasa daerah yang berbeda di Indonesia. Bahasa Bali mewakili wilayah Bali-Sasak-Sumbawa, sementara Minangkabau melambangkan wilayah Malayo-Chamic di Sumatera, dan Bahasa Bugis mewakili Sulawesi Selatan.
"Meskipun begitu, kami sempat kesulitan mencari native speaker bahasa Bugis karena mayoritas warga Sulawesi Selatan itu menggunakan bahasa Makassar. Jadi kami betul-betul harus mencari sampai ke desa Bugis, ya itu salah satu tantangannya sampai akhirnya selama rentang waktu 48 pekan, FAIR Forward berhasil mencapai target pembangunan data sebesar 10.000.000 kata," lanjut Ayu.
Proses ini melibatkan anotator remote dari masyarakat setempat dengan beragam latar belakang dialek dan jenis pekerjaan, memastikan representasi yang seimbang dari gender. Selanjutnya, Ayu memperkenalkan data tersebut dipublikasikan pada platform HuggingFace, memungkinkan akses yang mudah bagi industri dan para peneliti.
Di lain sisi, Andianto Haryoko selaku Koordinator Ekosistem dan Pemanfaatan TIK, Bappenas RI menyampaikan bahwa program tersebut juga turut melibatkan Bappenas sebagai pembuat kebijakan dan mempertegas kemampuan analitikal. Menurutnya, tools ai dapat mengetahui kebutuhan terkini dan tantangannya, serta membantu policy making yang relevan untuk hari ini sampai tahun 2045 menuju Indonesia emas.
"Kegiatan ini merupakan bagian dari proyek pemerintah bilateral melalui Bappenas. Banyak sekali kegiatan pemerintah terutama pelayanan publik yang memanfaatkan teknologi maju demi meningkatkan transparansi dan pelayanan publik. Tools knowledge perlu dikirimkan masyarakat, agar pesan pembangunan dan pemberdayaan lebih cepat sesuai sosiologis masyarakat, budaya, dan bahasa daerahnya," kata Andi.
(sud/sud)