Sistem Pengenalan Kata dengan Menggunakan Linear Predictive Coding
dan Nearest Neighbor Classifier
Dengan adanya kemajuan teknologi yang begitu pesat, saat ini untuk menjalankan suatu aplikasi cukup dengan mengucapkan sebuah kata saja contohnya seperti pada aplikasi voice dialing. Sebenarnya hal ini dapat dilakukan dengan sebuah komputer. Namun untuk membeli sebuah komputer adalah suatu hal yang tidak praktis, ukurannya relatif besar dan mahal harganya. Karena itu dalam makalah ini dipaparkan pengembangan suatu sistem pengenalan kata dengan menggunakan sebuah mikroprosesor dengan harga yang lebih murah dan ukuran relatif kecil.
Metode yang digunakan dalam sistem ini adalah metode linear predictive coding (LPC) dan nearest neighbor classifier. LPC digunakan untuk meng¬ekstrak pola kata dari suara yang di-input-kan. Sedangkan metode nearest neighbor classifier digunakan untuk mengenali kata yang di-input-kan. Sistem yang telah didisain diimplementasikan pada mikroprosesor TMS320C5x yang merupakan proses khusus untuk pemrosesan sinyal digital.
Selanjutnya pada bagian kedua makalah ini akan menjelaskan tentang sistem yang telah didisain mulai dari perangkat keras, perangkat lunak dan sistem secara umum. Bagian ketiga dari makalah ini akan menjelaskan hasil pengujian yang telah dilakukan untuk sistem yang telah dibuat. Dan makalah ini akan ditutup dengan diskusi dan kesimpulan yang telah diambil berdasarkan hasil pengujian yang telah dilakukan.
Sistem Pengenalan Kata
Pada dasarnya konsep perencanaan sistem pengenalan kata dapat dilihat pada blok diagram perangkat keras yang ditunjukkan oleh gambar 1 dan blok diagram sistem pengenalan kata yang ditunjuk¬kan oleh gambar 2.
Secara garis besar, cara kerja perangkat keras adalah input suara manusia yang masuk akan diterima oleh mikrofon dengan tujuan untuk mengubah sinyal suara menjadi sinyal listrik. Karena sinyal output dari mikrofon sangat lemah, maka diperlukan sebuah rangkaian yang berfungsi untuk memperkuat sinyal dari mikrofon tersebut. Rangkaian tersebut disebut sebagai rangkaian penguat depan.
kali dari frekuensi sinyal yang akan di-sampling. Lama waktu sampling data adalah setengah detik dengan demikian dalam satu kali sampling akan diperoleh 4000 data. Kemudian data ini akan diproses dengan analisa LPC sehingga menghasilkan koefisien-koefisien cepstral yang menjadi parameter untuk dikenali. Metode yang digunakan untuk pengenalan kata adalah metode nearest neighbor classifier.
Linear Predictive Coding (LPC)
Ide dasar dari LPC adalah bahwa sebuah sinyal suara manusia pada waktu n, s(n), dapat diperkirakan sebagai kombinasi linier dari p sinyal suara manusia sebelumnya. Hal ini direpresentasikan dengan meng¬gunakan persamaan berikut[1]:
snasnasnasnp ()1.(1)2.(2)....()
≈ −+−++ p −(1)
dimana koefisien-koefisien a1, a2, ..., ap merupakan asumsi konstanta dari sebuah bagian dari analisa suara manusia. Persamaan 1 dapat diubah dengan menambahkan sebuah eksitasi G.u(n) sehingga menjadi:
Penguat Depan TMS320C5x DSP Starter Kit
Mikrofon Output p
sna i sniGun
() .().()
=−+
∑ (2)
i=1
Kemudian sinyal dari mikrofon yang telah diperkuat oleh rangkaian pre-amplifier akan di-sampling oleh analog to digital converter (ADC) yang berfungsi mengubah sinyal listrik analog menjadi sinyal digital. Rangkaian ADC ini sudah terdapat di dalam TMS320C5x DSP starter kit. Sinyal digital dari ADC ini akan diolah untuk dikenali dan kemudian hasilnya ditampilkan di LCD.
Sinyal analog dari mikrofon di-sampling dengan frekuensi 8000 Hz. Pemilihan frekuensi sampling sebesar 8000 Hz karena frekuensi terbesar dari sinyal yang akan di-sampling adalah 3400 Hz sesuai dengan frekuensi suara manusia sekitar 600 – 3400 Hz. Hal ini dikarenakan adanya syarat bahwa frekuensi sampling minimal dua
dimana u(n) adalah eksitasi yang dinormalisasi dan G adalah penguatan dari eksitasi tersebut.
Langganan:
Posting Komentar (Atom)
Tidak ada komentar:
Posting Komentar