Modélisation acoustique multi-variable pour l’évaluation de la compréhension de la parole pathologique
No Thumbnail Available
Files
Date
2025-02-26
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Les troubles pathologiques de la parole entravent considérablement l'efficacité de la communication et la qualité de vie. Les méthodes diagnostiques traditionnelles, souvent subjectives et chronophages, limitent la précision et l'efficacité de l'identification de ces pathologies. Cette thèse présente un nouveau système automatisé de classification de la parole pathologique et de reconnaissance de la voix dysarthrique, visant à améliorer la précision et la rapidité du diagnostic. Ce système utilise une approche globale, combinant des techniques avancées de traitement du signal, une extraction de caractéristiques robuste et des architectures d'apprentissage profond de pointe. En intégrant de multiples caractéristiques acoustiques, notamment les MFCC, les PNCC, les spectrogrammes Mel, la gigue et le scintillement, le système capture des informations détaillées sur le signal vocal. De plus, des techniques d'amélioration de la parole, telles que la réduction du bruit basée sur les MMSE, sont appliquées pour améliorer la qualité d'entrée, notamment dans les environnements bruyants.
Au cœur de ce système se trouve un modèle d'apprentissage profond combinant des réseaux de neurones convolutifs (CNN) avec des réseaux de mémoire à long terme bidirectionnels (BiLSTM), modélisant efficacement les dépendances locales et temporelles au sein du signal vocal. Une évaluation rigoureuse d'un ensemble diversifié d'échantillons vocaux pathologiques a démontré la supériorité du système par rapport aux méthodes existantes. Ces résultats soulignent son potentiel à transformer le diagnostic et la prise en charge des troubles de la parole, contribuant ainsi à l'amélioration des résultats et de la qualité de vie des patients.
Description
94 p. : ill. ; 30 cm (+ CD-Rom)
Keywords
Troubles pathologiques de la parole, Classification de la parole, Architectures d'apprentissage profond, Reconnaissance de la parole dysarthrique, Communication acoustique