Pemilihan Kata Benda Bahasa Indonesia Berdasarkan Cakupan Suku Kata Menggunakan Genetic Algoritma untuk Dataset Audio Visual

JEPIN (Jurnal Edukasi dan Penelitian Informatika)(2023)

引用 0|浏览0
暂无评分
摘要
Dalam pembentukan model Kecerdasan Buatan yang menggunakan pendekatan Deep Learning, dataset memegang peranan yang sangat penting. Memahami dan memilih kumpulan data yang tepat, sangatlah penting untuk memastikan keberhasilan sebuah model Kecerdasan Buatan. Salah satu topik yang cukup baru adalah mempelajari bagaimana pembentukan suara dari hasil pembacaan gerakan bibir manusia, dengan cakupan variasi bunyi dan bentuk bibir yang diharapkan dapat membantu pembelajaran sistem. Mayoritas dataset audio visual, yang biasa digunakan untuk pembangunan model pembentukan suara ataupun pembacaan gerakan bibir tidak memperhatikan keluasan cakupan variasi bunyi yang ada. AVID, salah satu dari dataset audio visual berbahasa Indonesia, mengadopsi susunan kata dalam dataset GRID, yang mengubah setiap kata penyusunnya dari Bahasa Inggris ke bahasa Indonesia. Sedangkan pada Bahasa Indonesia sendiri terdapat banyak ragam bunyi yang dibentuk dari satu atau sederet rangkaian fonem. Penelitian yang dilakukan penulis dengan memanfaatkan Genetic Algorithm untuk mendapatkan susunan kombinasi kata benda guna memperoleh nilai cakupan yang optimal. Dengan cakupan kombinasi suku kata yang lebih baik, maka dapat dihasilkan dataset untuk Deep Learning yang lebih baik lagi. Dalam penelitian ini, kata benda yang diproses, diperoleh dari KBBI edisi 2008, baru kemudian difilter untuk mendapatkan kata benda yang tepat mengandung 3 suku kata, yang bukan nama kota, tokoh maupun lokasi. Dari 39.070 kata benda yang ada, diperoleh 2936 kata benda yang akan digunakan. Ujicoba yang telah dilakukan pada 10.000 hingga 200.000 epoch, diperoleh rata-rata cakupan suku kata 72%-75% dengan batasan 26 variasi kata benda penyusunnya.
更多
查看译文
关键词
indonesia
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要