Afficher la notice abrégée
dc.contributor.author |
Zaidi, Brahim Fares |
|
dc.date.accessioned |
2024-10-02T13:20:47Z |
|
dc.date.available |
2024-10-02T13:20:47Z |
|
dc.date.issued |
2023-07-18 |
|
dc.identifier.uri |
http://repository.usthb.dz//xmlui/handle/123456789/9886 |
|
dc.description |
165 p. : ill. ; 30 cm. (+ CD-Rom) |
en_US |
dc.description.abstract |
La parole est un moyen de communication très important dans la vie humaine. C'est non seulement un moyen de communication, mais aussi un outil d'information sur l'âge, les émotions, la santé et l'identité du locuteur. Par ailleurs, le domaine de traitement de la parole est orienté sur divers application tels que la reconnaissance automatique de la parole, la reconnaissance de l'identité du locuteur et la synthèse de la de la parole.
Dans ce travail de recherche nous avons orienté notre étude sur la reconnaissance automatique de la parole pathologique plus précisément nous avons travaillez avec la voix dysarthrique. En effet la dysarthrie est une maladie caractérisée par une faiblesse des muscles respiratoires. Le discours devient lent ou peut être difficile à comprendre. Pour cela l'objectif principale de notre recherche est basé sur l'aide aux personnes atteintes cette pathologique vocale et de leurs offrir une novelle indépendance dans leurs vie par l'accès aux services fournis par les nouvelles Technologies de l'Information et de la Communication et aussi aidé le médecin de faire son premier diagnostic sur cette maladie à travers une interface de commande.
Pour cela dans cette étude de recherche nous avons apportée des nouvelles contributions pour l'amélioration de la reconnaissance automatique de la parole dysarthrique sur la base de données NEMOURS.
La première contribution consiste à la réalisation d'un système de reconnaissance automatique de la parole dysarthrique basé sur les modèles HMM-GMM puis la conception de deux systèmes de reconnaissance automatique de la parole dysarthrique basée sur les réseaux de neurones CNN et LSTM. Les résultats ont montré que le système basé sur CNN en utilisant la fonction polynomiales Poly1ReLU que nous avons proposées comme alternative aux fonctions conventionnelles donne le meilleur taux de reconnaissance de 82%. Cela représente une amélioration de 11% et 32% par rapport aux performances des systèmes basés sur LSTM et HMM-GMM, respectivement.
La deuxième contribution consiste à l'utilisation des trois analyseurs acoustiques qui utilisent la modélisation de la perception auditive, à savoir les MFCC, les MFSC et les coefficients PLP. Les résultats montrent que l'analyse par PLP lorsqu'on utilise un système basé sur CNN sont plus performant.
La troisième contribution consiste à la réalisation d'une interface de commande d'un système de reconnaissance automatique de la parole.
Aujourd'hui notre défi est la disponibilité d'une grande quantité de données de la parole pathologique qui est obligatoire pour l'amélioration de la reconnaissance automatique de la parole pathologique. |
en_US |
dc.language.iso |
en |
en_US |
dc.subject |
Troubles de la parole ; Réseaux neuronaux ; Reconnaissance automatique de la parole ; Dysarthrie ; Acoustique |
en_US |
dc.title |
Interfaces vocales robustes en communication verbale alternative dédiées systèmes de télécommunications |
en_US |
dc.type |
Thesis |
en_US |
Fichier(s) constituant ce document
Ce document figure dans la(les) collection(s) suivante(s)
Afficher la notice abrégée