Veuillez utiliser cette adresse pour citer ce document :
http://dspace.univ-bouira.dz:8080/jspui/handle/123456789/6971
Titre: | Reconnaissance automatique de la parole avec intelligence artificielle |
Auteur(s): | LOUIFI, Massinissa OUABDESSELAM, Feriel |
Mots-clés: | LPC, MFCC, NPC, MLP, traitement automatique de la parole , langue Amazigh, intelligence artificielle. |
Date de publication: | 23-sep-2017 |
Editeur: | Université Akli Mouhand Oulhadj-Bouira |
Résumé: | Le Chapitre 1 est une introduction à la phonétique et présente les systèmes régissant le langage chez l’être humain et le fonctionnement des appareils concernés, introduisant ainsi le système physiologique et le système neurologique et leur anatomie. Le système physiologique se constitue de l’appareil phonatoire qui est le moteur de la production du son des différents phonèmes grâce à l’interaction des trois grands organes (les poumons, le larynx et les cavités bucco-pharyngale) et l’appareil auditif qui a comme organe principal l’oreille est le centre du traitement acoustique et cognitif. Le système neurologique est la partie nerveuse dite le cerveau qui est constitué de neurones assurant ainsi le traitement des différents sons des phonèmes et leur compréhension. Le chapitre 2 présente le traitement automatique de la parole. Ce dernier comportera les différentes caractéristiques du signal de parole, évoquant les étapes de la numérisation et détaillant les méthodes traditionnellement mises en oeuvre pour cette analyse. Ce chapitre sera l’occasion de présenter en profondeur les différentes méthodes du codage LPC et MFCC. Le chapitre 3 comportera une introduction globale sur l’intelligence artificielle, puis précisément sur les réseaux de neurones, leur évolution durant le siècle dernier citant les différents types des réseaux de neurones. On se focalisera sur un perceptron multicouche MLP afin d’utiliser un nouveau modèle pour l’extraction de caractéristiques le Codage Neuro-Prédictif (NPC, Neural Predictive Coding) qui est une extension au domaine non-linéaire du codage LPC. Le chapitre 4 sera consacré à une présentation de la langue Amazighe et précisément les lettres Tifinagh puis à l’étude de la mise en forme d’un signal de parole qui sera injecté dans un réseau de neurones MLP (Multi Layer Perceptron), puis la comparaison entre les résultats obtenus par l’utilisation des deux codages : MFCC (Mel Frequency Cepstral Coding) et NPC (Neuronal Predictive Coding). |
URI/URL: | http://dspace.univ-bouira.dz:8080/jspui/handle/123456789/6971 |
Collection(s) : | Mémoires Master |
Fichier(s) constituant ce document :
Fichier | Description | Taille | Format | |
---|---|---|---|---|
MFE.pdf | 4,28 MB | Adobe PDF | Voir/Ouvrir |
Tous les documents dans DSpace sont protégés par copyright, avec tous droits réservés.