Il s’appelle Mesṭafa Kamal, il a 25 ans. En ce 28 juin, il a réussi sa soutenance avec brio sur un projet unique : l’application du deep learning à la langue kabyle afin de réussir une reconnaissance vocale.
Concrètement, l’étudiant de l’ESI (Ecole Supérieur d’Informatique) à Alger, a mis en place une application, qui, quand on lui parle en Kabyle, arrive à retranscrire ce qu’on lui dit.
Pour cela, Mesṭafa, originaire d’At Wasif, a appliqué une technique d’intelligence artificielle qui permet à la machine de faire de l’apprentissage de la langue Kabyle en associant chaque son à une lettre ou une syllabe. Un défi ambitieux qui nécessite une quantité gigantesque de données vocales et leur transcription.
Merci à la communauté Common Voice !
L’étudiant, qui a obtenu une mention très bien lors de la présentation de son projet, a accompli une véritable prouesse. Et cela n’a été possible que grâce au corpus vocal conséquent qu’une communauté de plus de 800 kabyles ont pu constituer sur la plateforme Common voice de Mozilla.
« Un premier projet unique en son genre dans l’histoire de ce pays« , a commenté Muḥend At Belqasem, un des contributeurs principaux de common voice, qui a été, avec l’ingénieur de Mozilla Alexandre Lissy, d’une aide précieuse pour l’étudiant.
Ce projet constitue une application concrète du corpus Common Voice qui a rassemblé des centaines de bénévoles depuis plusieurs mois afin de valider pas moins de 500h de phrases. Ce qui fait classer la langue Kabyle à la 4e place, après l’anglais, l’allemand et le français.
Le modèle mis en place par Mesṭafa Kamal sera encore plus précis, lorsque l’objectif de 1200h de phrases enregistrées sur Common Voice sera atteint.