Résumé:
La maladie de Parkinson (MP) est l'une des maladies les plus neurodégénératives après Alzheimer. Cette maladie est considérée comme une pathologie qui implique des perturbations paramétriques de la voix des patients. Ce travail décrit une méthode proposée qui vise à diagnostiquer les personnes atteintes de la MP en analysant leurs signaux vocaux.
Trois approches sont proposées dans cette thèse. En premier lieu, nous donnons une approche basée sur l'analyse des voix des participants malades et non malades après extraction de vingt-six paramètres acoustiques classiques obtenus par le logiciel Praat. Deux étapes sont ensuite réalisées. La première consiste à utiliser la matrice de 26 paramètres obtenus, sans prétraitement. Cela a donné une précision de 85%. Ensuite, une analyse par composantes principales (ACP) est appliquée sur la matrice de données, afin de réduire le nombre de paramètres à des nouveaux paramètres appelés les composantes principales (CP). On retient ainsi les paramètres ayant moins de corrélation aidant notre modèle Bayésien à classer les données avec une hypothèse d'indépendance. En conséquence, la dimensionnalité de l'espace de données a été réduite de 26 paramètres à l'origine à 7 CP. Le classifieur Bayésien utilisant ces 7 composantes a atteint une précision de 91%.
En second lieu, une nouvelle approche est proposée. Elle est basée sur une standardisation par type de voyelle appliquée sur l'ensemble de paramètres cepstraux Mel (MFCC). Les vecteurs formés par ces paramètres modifiés sont utilisés pour améliorer et faciliter la tâche de discrimination entre les voix normales et celles ayant de la MP. En fait, les paramètres standardisés proposés étaient les entrées d'un classifieur K plus proche voisins (KNN). Une précision de classification de 98 % est obtenue lors de l'utilisation de KNN avec une distance euclidienne, comparativement à notre étude lors de l'utilisation des paramètres non standardisés, où une précision de 78% a été obtenue.
En dernier lieu, une nouvelle technique de prétraitement est ainsi réalisée. L'approche utilise des matrices à trois dimensions construites pour chaque sujet. Les matrices sont composées de vecteurs arrangés par segment, par type de paramètres et selon le nombre de valeurs instantanées formant chaque vecteur de paramètres. Une estimation des valeurs maxima maximorum (MM) et minima minimorum (mm) est utilisée pour normaliser les données. Par la suite, chacun des vecteurs normalisés est soumis à un processus de suppression des valeurs aberrantes. Les performances des attributs prédits effectifs ont été testées à l'aide d'une analyse statistique appelée test de Wilcoxon-Mann-Whitney (MWW). Ensuite, une phase de décision est réalisée en appliquant trois types de classifieurs : un algorithme KNN, un algorithme par machine à vecteur de support (SVM) et un classifieur des forêts aléatoires (RF). Même si les trois types de classifieurs utilisés donnent des décisions à taux élevé, les résultats expérimentaux ont montré que le classifieur RF améliore mieux l'efficacité de l'approche de prétraitement en atteignant un taux de reconnaissance de 99% pour les femmes et 98% pour les hommes, lors la détection de la dysphonie de la MP.