Model AI Yang Ditingkatkan Untuk Mengenali Ekspresi Wajah – Struktur jaringan saraf yang diusulkan dengan konvolusi yang dapat dipisahkan secara mendalam dan unit residu yang telah diaktifkan sebelumnya.

Model AI Yang Ditingkatkan Untuk Mengenali Ekspresi Wajah

Ketika sampai pada keadaan pikiran dan emosi kita, wajah kita bisa sangat jelas. Ekspresi wajah merupakan aspek penting dari komunikasi nonverbal pada manusia. Bahkan jika kita tidak dapat menjelaskan bagaimana kita melakukannya, kita biasanya dapat melihat di wajah orang lain bagaimana perasaan mereka.

Dalam banyak situasi, membaca ekspresi wajah sangat penting. Misalnya, seorang guru mungkin melakukannya untuk memeriksa apakah siswa mereka terlibat atau bosan, dan seorang perawat dapat melakukannya untuk memeriksa apakah kondisi pasien telah membaik atau memburuk.

Berkat kemajuan teknologi, komputer dapat melakukan pekerjaan yang cukup baik dalam hal mengenali wajah. Mengenali ekspresi wajah, bagaimanapun, adalah cerita yang sama sekali berbeda.

Banyak peneliti yang bekerja di bidang kecerdasan buatan (AI) telah mencoba mengatasi masalah ini menggunakan berbagai teknik pemodelan dan klasifikasi, termasuk jaringan saraf convolutional (CNN) yang populer. Namun, pengenalan ekspresi wajah itu rumit dan membutuhkan jaringan saraf yang rumit, yang membutuhkan banyak pelatihan dan mahal secara komputasi.

Dalam upaya untuk mengatasi masalah ini, tim peneliti yang dipimpin oleh Dr. Jia Tian dari Jilin Engineering Normal University di China baru-baru ini mengembangkan model CNN baru untuk pengenalan ekspresi wajah. Seperti yang dijelaskan dalam sebuah artikel yang diterbitkan dalam Journal of Electronic Imaging, tim berfokus pada keseimbangan yang baik antara kecepatan pelatihan, penggunaan memori, dan akurasi pengenalan model.

Salah satu perbedaan utama antara model CNN konvensional dan yang diusulkan oleh tim adalah penggunaan konvolusi yang dapat dipisahkan secara mendalam. Jenis konvolusi ini operasi inti yang dilakukan pada setiap lapisan CNN berbeda dari yang standar karena ia memproses saluran yang berbeda (seperti RGB) dari gambar input secara independen dan menggabungkan hasilnya di akhir.

Dengan menggabungkan jenis konvolusi ini dengan teknik yang disebut “blok residu yang telah diaktifkan sebelumnya”, model yang diusulkan dapat memproses ekspresi wajah input secara kasar hingga halus.

Dengan cara ini, tim sangat mengurangi biaya komputasi dan jumlah parameter yang diperlukan untuk dipelajari oleh sistem untuk klasifikasi yang akurat. “Kami berhasil mendapatkan model dengan kemampuan generalisasi yang baik dengan sedikitnya 58.000 parameter,” kata Tian.

Para peneliti menguji model mereka dengan membandingkan kinerja pengenalan ekspresi wajahnya dengan model lain yang dilaporkan di ruang kelas. Mereka melatih dan menguji semua model menggunakan kumpulan data populer yang disebut “Dataset Cohn-Kanade yang Diperpanjang ” yang berisi lebih dari 35.000 gambar berlabel wajah yang mengekspresikan emosi yang sama.

Hasilnya menggembirakan, dengan model yang dikembangkan oleh tim Tian menunjukkan akurasi tertinggi (72,4%) dengan jumlah parameter paling sedikit.

Model AI Yang Ditingkatkan Untuk Mengenali Ekspresi Wajah

“Model yang kami kembangkan sangat efektif untuk pengenalan ekspresi wajah saat menggunakan kumpulan data sampel kecil. Langkah selanjutnya dalam penelitian kami adalah untuk lebih mengoptimalkan arsitektur model dan mencapai kinerja klasifikasi yang lebih baik lagi,” kata Tian.

Mengingat pengenalan ekspresi wajah dapat digunakan secara luas di bidang-bidang seperti interaksi manusia-komputer, mengemudi yang aman, pemantauan cerdas, pengawasan, dan kedokteran, marilah kita berharap tim segera mewujudkan visi mereka.

Informasi lebih lanjut: Jia Tian et al, Pengenalan ekspresi wajah di lingkungan kelas berdasarkan model Xception yang ditingkatkan, Journal of Electronic Imaging (2022). DOI: 10.1117/1.JEI.31.5.051416