Théses de Doctorat

Permanent URI for this collectionhttp://192.168.16.104:4000/handle/123456789/1849

Browse

Search Results

Now showing 1 - 10 of 368

Caractérisation et identification automatique des langues en communications téléphoniques
(2023-09-23) Lounnas, Khaled
L'utilisation croissante des technologies de reconnaissance automatique de la parole (ASR) a donnée lieu à diverses applications, telles que la dictée vocale sur ordinateur et les serveurs vocaux interactifs. Cette thèse se concentre sur l'identification automatique des langues et des dialectes arabes. Les contributions incluent l'application de méthodes de machine Learning classiques et d'apprentissage profond pour étudier les classifications hiérarchiques des dialectes arabes. L'utilisation combinée d'approches d'apprentissage par transfert permet de créer un système performant avec des ressources limitées. L'intégration d'un module d'identification des langues/dialectes améliore également la reconnaissance des chiffres prononcés pour les langues avec peu de ressources disponibles. Les systèmes développés ont été testés sur différents corpus provenant de diverses sources de collecte de données. Une approche basée sur le transfert d'apprentissage a été utilisée pour identifier les dialectes maghrébins, qui sont plus complexes que les dialectes arabes. Deux méthodes principales ont été employées. La première consiste à re-entraîner plusieurs modèles de transfert d'apprentissage, tels que ResNet50, ResNet101, VGG16, VGG19, DenseNet121, DenseNet169 et MobileNet, en variant le nombre de couches. La deuxième approche utilise la stratégie de "stacked generalization" pour fusionner efficacement les prédictions des modèles préalablement entraînés. Les résultats démontrent que cette approche en cascade a le potentiel d'améliorer les performances du système d'identification des langues/dialectes, avec une augmentation de 5% dans l'identification entre le dialecte marocain MBD et l'arabe standard algérien ASM. De plus, un score de reconnaissance des chiffres parlés atteignant 99,11% a été obtenu pour les dialectes marocain et algérien. La deuxième contribution de cette thèse consiste a' améliorer la reconnaissance de la parole. Nous avons entraîné un système ASR hybride (combinaison d'un système d'identification de la langue (LI) et celui de ASR) en utilisant cinq classificateurs basés sur l'apprentissage automatique et deux modèles d'apprentissage profond : un modèle bas ?e sur un réseau neuronal convolutif (CNN) et un autre utilisant deux modèles pre-entraînés, à savoir Residual Deep Neural Network (Resnet50 et Resnet101). Les résultats démontrent que le modèle CNN surpasse les autres méthodes proposées et améliore les performances du système de reconnaissance des chiffres parlés de 20% pour les dialectes algériens et marocain. En général, les résultats montrent l'efficacité de l'apprentissage automatique dans la plupart des systèmes, en témoignant du bon comportement de nos systèmes lors de l'utilisation de descripteurs appropries avec le bon choix de modèle qui décrivent bien les dialectes en question.
Contribution à l’implémentation de tâches d’interaction et de navigation évoluées pour un robot de service
(2024-04-18) Bellarbi, Abir
Cette thèse propose une méthode de navigation respectant à la fois la notion traditionnelle de risque de collision et la notion de risque de perturbation. Vu la demande croissante de robotique de service mobile, les robots et les personnes doivent partager les mêmes espaces physiques et suivre les mêmes conventions sociales. Les robots doivent respecter les contraintes de proximité mais aussi respecter les personnes qui interagissent entre eux. Par exemple, ils ne peuvent pas interrompre l'interaction entre des personnes en conversation, à moins que la tâche du robot ne soit d'y participer. Dans ce cas, le robot doit pouvoir intégrer le groupe en utilisant un comportement socialement adapté. Dans la plupart des travaux antérieurs traitant la problématique de la navigation sociale et de l'interaction Homme-Robot, le type d'organisation spatiale d'un groupe de personnes appelée "F-Formation" n'était pas pris en compte, de plus le concept de Proxémie a été considéré comme statique par rapport à la nature de l'activité. Les différentes activités des personnes ne peuvent pas être considérées de la même manière. Par exemple, la façon de naviguer socialement sans déranger un groupe buvant du café ou discutant d'un poster est différente, tout comme la position d'interaction pour servir du café ou expliquer un poster. La principale contribution de ce travail est de proposer une approche de modélisation dynamique de la Proxémie "DPMA" pour la navigation et l'interaction sociales, en intégrant à la fois une évaluation d'un risque de collision, et une évaluation du respect des conventions sociales. Cette approche se base sur la Proxémie et la modélisation spatiale, permettant au robot de naviguer en sécurité tout en considérant le confort des personnes, et d'interagir dans des conditions d'interaction appropriées. La gestion humaine de l'espace (espace personnel, espace d'interaction, espace d'activité...) inspirée de la littérature en sociologie et en robotique sociale est intégrée sous forme de modèles dédié à chaque espace. D'un autre côté, le type de F-Formation et la nature des activités sont développés et intégrés à ce travail, afin de permettre au robot de rejoindre un groupe de personne sans perturbations, tout en traitant chaque activité différemment. Les performances et l'efficacité de l'approche DPMA sont évaluées dans trois environnements de simulation à l'aide du simulateur Stage de ROS, ainsi que sur un robot mobile utilisé comme robot de service dans une conférence. Les résultats de simulation et d'expérimentation valident l'approche en montrant que notre robot est capable de naviguer dans un environnement humain en évitant les collisions avec les obstacles et les personnes et, à la fois, capable de minimiser l'inconfort des personnes en respectant les différentes conventions sociales liées aux espaces sociaux modélisés.
Development of a prototype of a solar greenhouse adapted to semi-arid regions
(2024-02-12) Badji, Ahmed
Cette thèse étudie l'utilisation croissante des serres dans les régions semi-arides du Sahara. La recherche se concentre sur l’exploration des défis économiques, technologiques et environnementaux impliqués dans les changements agricoles dans ces régions. Plus précisément, l'étude examine comment les technologies de l'énergie solaire peuvent être intégrées dans les serres agricoles pour créer un cadre complet alliant durabilité et innovation. Les serres sont devenues industrialisées dans l’agriculture moderne et la rentabilité est un facteur crucial. Une approche stratégique est nécessaire pour maximiser la production végétale, y compris une conception, une structure et un contrôle climatique complets. La gestion du microclimat est une priorité, où des solutions telles que la fertilisation carbonée, la récupération des gaz à effet de serre et les sources d'énergie alternatives peuvent améliorer la productivité tout en réduisant l'impact environnemental. Malgré des progrès significatifs dans la technologie des serres, il reste encore des lacunes dans l’optimisation des microclimats des serres. Ce vide est un problème urgent qui entrave une production agricole élevée et augmente les coûts opérationnels et la consommation d’énergie. Cette recherche vise à combler cette lacune en développant une approche holistique intégrant la conception, la technologie et la gestion des microclimats des serres. L’objectif principal de cette recherche est de créer des initiatives concrètes qui peuvent façonner l’avenir de l’agriculture en serre. L'accent est mis sur le développement d'un prototype de serre solaire spécialement conçu pour répondre aux défis des climats semi-arides. Il s'agit de créer un modèle tangible et d'intégrer un système de chauffage et de refroidissement innovant pour réguler l'environnement interne en réponse aux conditions météorologiques semi-arides. Une approche intégrée est envisagée, dans laquelle divers aspects, notamment la conception, la technologie et les principes de gestion, travaillent ensemble pour optimiser les performances des serres. Le cadre proposé comprend des techniques d'apprentissage automatique pour la modélisation du microclimat et la conception et le développement d'un chariot d'acquisition pour le contrôle des données en temps réel. Cette thèse est divisée en six chapitres, chacun contribuant à un aspect spécifique d’amélioration et de durabilité des serres. La revue de la littérature établit une base complète en examinant les connaissances existantes et en identifiant les lacunes, fournissant ainsi une feuille de route pour les recherches ultérieures. Le contrôle et la modélisation des serres utilisent des algorithmes d'apprentissage automatique comme outils d'intelligence artificielle pour améliorer l'efficacité et la productivité. Enfin, les autres chapitres sur la gestion du climat des serres abordent divers aspects, notamment un système de chauffage innovant avec stockage, l'intégration des énergies renouvelables, le contrôle des hautes températures avec refroidissement par évaporation (FAN-PAD) et les performances du système d'ombrage pour le refroidissement. En conclusion, ce doctorat. La thèse cherche à catalyser un changement transformateur dans l’agriculture en serre en combinant des concepts de conception innovants, une technologie de pointe et des stratégies de gestion sophistiquées. Le cadre holistique proposé vise à optimiser les microclimats des serres et à établir un système durable et efficace qui s’aligne sur les impératifs mondiaux de sécurité alimentaire et de gestion de l’environnement.
Techniques de retouche (inpainting) des vidéos, contrôlées par des mesures perceptuelles de la qualité
(2024-03-04) Rezki, Mohamed Amine
L'inpainting est une technique couramment utilisée dans le traitement d’image et l'infographie. Sa finalité principale est de restaurer les zones manquantes ou endommagées d'une image ou d'une vidéo en les remplissant d'un contenu approprié, cohérent avec le reste de l'image ou de la vidéo. Cette technique a un large éventail d'applications, allant de la reconstruction de zones endommagées à la restauration de parties manquantes, en passant par la suppression d'objets indésirables ou la modification du contenu. De plus pour la vidéo, inpainting est utilisé dans la post-production cinématographique, la restauration de vieux films et comme traitement de post-stabilisation dans les vidéos médicales diffusées. Cette thèse effectue une analyse exhaustive des approches actuelles d'inpainting d'images et de vidéos, mettant également l'accent sur leur évaluation. Nos majeures contributions consistent en la Proposition d'une mesure novatrice de la qualité des images retouchées, nommée B-IIQA (Blind Image Inpainting Quality Assessment). Cette approche est basée sur la continuité des structures locales. Face à la lacune de mesures dédiées à l'évaluation de la qualité des vidéos retouchées, nous avons jugé pertinent d'étendre la mesure B-IIQA à un contexte vidéo, créant ainsi B-VIQA (Blind Video Inpainting Quality Assessment). Cette adaptation intègre les caractéristiques spatio-temporelles propres à la vidéo. De même, l'absence d'une base de données généralisable, correctement étiquetée et intégrant les méthodes contemporaines d'inpainting des vidéos s'est avérée être un défi. Nous avons comblé cette lacune en proposant une base de données de vidéos dédiée à l'inpainting. Nos travaux ont été soumis et publiés, consolidant ainsi leur contribution significative à la littérature dans le domaine.
Traitement et classification du signal pour la prothèse du membre inférieur
(2024-05-25) Madaoui, Lotfi
Les prothèses actives deviennent de plus en plus une option viable pour les amputés des membres inférieurs, car elles peuvent considérablement améliorer leur qualité de vie et leur mobilité. Cependant, pour garantir un contrôle robuste et efficace de ces prothèses, l'environnement du terrain doit être pris en compte. Dans cette thèse nous avons présenté deux méthodes innovantes pour la reconnaissance des modes de locomotion. La première est basée sur des algorithmes d’apprentissage automatique et l’exploitation des caractéristiques temporelles (MLTF), ce qui en fait une solution efficace en termes de consommation d’énergie et de ressources. Le système utilise un seul capteur IMU placé sur le tibia et comprend toutes les étapes d'un processus LMR, c'est-à-dire le prétraitement du signal, l'extraction des caractéristiques, réduction/sélection des caractéristiques selon la nécessité du modèle et enfin l'estimation des terrains pour classifier cinq terrains. Plusieurs modèles machine learning ont été proposés, pour trouver à la fin le meilleur modèle pour les tâches LMR. La seconde méthode s’appuie sur le Deep Learning et l’encodage d’images pour la reconnaissance des modes de locomotion (DLIE). Dans cette approche nous avons développé un système de reconnaissance des modes de locomotion mettant en œuvre des CNN et des LSTM avec un encodage d'images pour classifier sept types de terrains. Nous avons utilisé trois méthodes d'encodage d'images pour transformer les données des capteurs inertiels en images d'activités, incluant des images de signal, le champ angulaire de Gramian et le Mel spectrogramme. Différentes configurations de reconnaissance des modes de locomotion sont étudiées et comparées en combinant différents réseaux et représentations d'encodage d'images. Les résultats montrent que le LMR-Net proposé avec une entrée de spectrogramme est le meilleur modèle, capable de classer le mode de locomotion avec un score F1 moyen de 0,9744 et un temps de 30,59 ± 1,77 ms, qui est inférieur à 300 ms, la latence maximale autorisée pour éviter de causer un inconfort à l'utilisateur de la prothèse. Le système de reconnaissance des modes de locomotion a été ensuite implémenté en embarqué. En raison des contraintes de ressources inhérentes à notre carte SoC, l’approche MLTF a été privilégiée pour l’implémentation. La carte Xilinx Zynq SoC XC7Z020–1CLG400C a été utilisé pour développer le prototype sur du matériel. Pour obtenir une conception matérielle flexible et efficace, l'architecture système proposée a été optimisé en utilisant des techniques de parallélisme et d'optimisation de la quantification. Cette approche a conduit à une amélioration significative des performances, avec une vitesse de traitement 15 fois plus rapide que l'approche non optimisée dans la partie PL, et 4,3 fois plus rapide que l'implémentation optimisée PS(-O3) sur la même carte Zynq FPGA. L'architecture proposée a également été validée en temps réel.
Evaluation objective et subjective des dégradations engendrées en radiocommunication sur la parole expressive
(2024-05-12) Hadjadji, Imene
Cette étude se penche sur l'évaluation de la dégradation de l'expression émotionnelle dans la parole générée par un réseau de téléphonie sans fil. Deux méthodes d'évaluation ont été développées : une méthode objective basée sur des réseaux neuronaux convolutifs, où plusieurs études ont été menées pour sélectionner le classifieur optimal, et une méthode subjective basée sur la perception humaine. L'étude a collecté des phrases expressives dans deux langues différentes : celles de locuteurs arabes novices et de locuteurs allemands professionnels. Ces énoncés ont été transmis sur un réseau 4G réel, ce qui est rare, car l'accent est généralement mis sur la réduction de la bande passante ou la compression. Notre innovation réside dans l'utilisation de l'infrastructure 4G complète, en tenant compte de toutes les altérations possibles. Les résultats obtenus montrent un impact significatif de la transmission via le réseau 4G réel sur la reconnaissance des émotions. Avant la transmission, les taux de reconnaissance les plus élevés, mesurés par la méthode objective en utilisant l'échelle de fréquence Mel, étaient de 76% pour l'arabe et de 91% pour l'allemand. Après la transmission, ces taux ont considérablement diminué, atteignant 70% pour l'arabe et 82% pour l'allemand (une dégradation de 6% et 9%), respectivement. En ce qui concerne la méthode subjective, les taux de reconnaissance étaient de 75% pour l'arabe et de 70% pour l'allemand avant la transmission, et sont tombés à 67% pour l'arabe et à 68% pour l'allemand après la transmission (une dégradation de 8% et 2%). Nos résultats ont également été comparés à ceux trouvés dans la littérature qui ont utilisé la même base de données allemande.
Modélisation polynomiales de signaux physiologiques
(2024-03-02) Guendouzi, Fatima
Cette thèse se focalise sur l’amélioration de l’analyse des électrocardiogrammes (ECG) en vue de la compréhension et du diagnostic précoce des arythmies cardiaques. La première contribution de ce travail réside dans une méthode de détection des pics R dans les signaux ECG, qui combine la Transformée en Ondelettes Empiriques (TOE), l’enveloppe de Hilbert et l’Algorithme de Pollinisation des Fleurs (APF), visant à accroître la précision de cette détection essentielle. Deuxièmement, cette thèse propose une méthode pour la détection et la classification des contractions ventriculaires prématurées (PVC) dans les ECG, en utilisant les coefficients polynomiaux de Tchebychev et le classificateur k-plus proches voisins (KNN). Ce travail cherche à améliorer l’efficacité de l’analyse des ECG, avec des implications importantes pour le diagnostic et la gestion des troubles cardiaques, tout en suggérant des pistes de recherche futures dans ce domaine.
Writer identification from handwritten text fragment via deep learning frameworks
(2024-07-08) Briber, Amina
Au cours des dernières décennies, la reconnaissance des scripteurs a été l’un des domaines de recherche les plus difficiles et fascinants dans le domaine de la reconnaissance des individus. Elle se divise en deux catégories : la vérification et l’identification du scripteur. Alors que la vérification du scripteur confirme l’identité de ce dernier, l’identification vise à l’identifier à partir des caractéristiques de l’écriture. Plusieurs applications sont concernées, telles que la criminalistique et l’analyse des documents historiques. Cependant, dans de nombreux scénarios, la disponibilité limitées des données mène à l’exploration d’approches alternatives. L’une des approches consiste à concevoir des systèmes à partir de fragments de textes manuscrits, ce qui présente des défis importants en raison de la variabilité des styles d’écriture et la quantité limitée de données pour concevoir un système robuste. Ces systèmes comprennent deux modules principales : la génération de caractéristiques et la classification. Les méthodes traditionnelles de génération de caractéristiques reposent sur des caractéristiques conçues manuellement et des connaissances d’experts, tandis que les progrès récents utilisent des techniques d’apprentissage profond pour l’extraction des caractéristiques et la classification. Malheureusement, dans plusieurs cas, ces systèmes sont lourds, dépendants de l’auteur et de la langue, et nécessitent une forte intensité de calcul. En outre, ils sont généralement fermés, ce qui signifie la nécessité d’un nouvel entraînement lors de l’ajout d’un nouveau scripteur au système. Par conséquent, la conception d’un système ouvert formé sur un petit sous-ensemble de scripteurs est une alternative intéressante pour l’identification des scripteurs. L’objectif de cette thèse est d’explorer diverses stratégies pour identifier un scripteur à partir de fragments de texte manuscrits en utilisant des systèmes d’apprentissage profond. Tous les systèmes proposés sont formés à partir de zéro et conçus en considérant deux tâches majeures : ouvertes et légères. Les principales contributions sont résumées ci-dessous : • Aborder la lourdeur des systèmes existants en proposant des méthodes légères d’apprentissage profond basées sur la classification en utilisant le réseau de neurones convolutif (CNN) comme extracteur de caractéristiques à partir de fragments de texte manuscrits. • L’utilisation d’autoencodeur convolutif (CAE) léger pour l’extraction de caractéristiques à partir de fragments de textes manuscrits afin de générer des caractéristiques indépendantes de l’auteur. En outre, l’introduction d’une nouvelle mesure pour évaluer l’efficacité des vecteurs de caractéristiques. • Explorer l’indépendance linguistique des scripteurs et la langue d’apprentissage en vue d’une généralisation à travers les ensembles de données et les styles d’écriture sur des documents contemporains et historiques. Toutes les expériences sont menées sur plusieurs ensembles de données de référence, à savoir IFN/ENIT, IAM, ICDAR 2017 et WAHD.
Modélisation électromagnétique des actionneurs électriques linéaires.
(2024-05-18) Sari, Moussa
Cette thèse représente une contribution à la modélisation analytique des phénomènes électromagnétiques en 2D en régime harmonique des problèmes axisymétriques. Il est appliqué sur deux structures, l'une est un tube cylindrique creux enroulé par deux bobines cylindriques, et l'autre est un lanceur tubulaire linéaire à induction LTLI. Son application vise à calculer le champ magnétique, la distribution de la densité des courants induits, les inductances propres et mutuelles, ainsi que la force de poussée dans ces systèmes. Dans les deux configurations proposées, tant pour l'inducteur que pour l'induit, la longueur dans la direction axiale est finie. Cette approche vise à prendre en compte les effets d'extrémité longitudinale. La modélisation électromagnétique proposée est basé sur la combinaison de la méthode TREEM (Truncated Region Eigen-function Expansion Method) avec la technique de séparation des variables pour résoudre les équations de Maxwell en termes de potentiel vectoriel magnétique, afin de prendre en compte la longueur finie dans la direction axiale de l’inducteur et de l’induit en même temps. De plus, le modèle analytique développé résoud également l'équation trigonométrique non linéaire pour calculer les valeurs propres complexes requises. Le modèle analytique développé a été validé en utilisant la méthode des éléments finis MEF avec le logiciel COMSOL Multiphysique. Pour valider les résultats de calcul développé, un prototype expérimental du LTLI a été conçu et réalisé. Les résultats expérimentaux obtenus ont été discutés et comparés à ceux obtenus à l'aide du modèle analytique et de la méthode des éléments finis. Une bonne concordance entre les résultats expérimentaux et ceux des modèles numériques a été observée, ce qui confirme la validité du modèle analytique développé. Une étude expérimentale du fonctionnement en régime transitoire du LTLI a été présentée.
Modélisation des sondes pour la caractérisation électromagnétique des matériaux
(2024-09-18) Miloudi, Khaled
Dans notre thèse, nous développons un modèle innovant de capteurs de courant inductifs utilisés dans la caractérisation électromagnétique des matériaux liquides. Notre approche de modélisation combine un modèle analytique du système et une étude numérique utilisant la méthode des éléments finis. Nous avons préféré un capteur électromagnétique à fonction absolue, où le changement d'impédance reflète les propriétés du matériau liquide. En créant un modèle inverse, nous avons pu déterminer les propriétés physiques de l'échantillon à partir de l'impédance du collecteur. Nos investigations théoriques ont abouti à un modèle de travail, qui a été renforcé par la confirmation empirique de sa validité. Une grande partie de nos travaux a été consacrée à l’amélioration des méthodes permettant d’évaluer avec précision la conductivité électrique des matériaux liquides. Il s’agit d’une recherche scientifique de pointe visant à fournir des résultats précis et efficaces. Nous avons appliqué notre approche à trois échantillons différents, L’optimisation a été réalisée à l'aide trois algorithmes meta-heuristiques de pointe dans notre étude approfondie. Ces efforts conjoints ont conduit à des avancées significatives dans la caractérisation électromagnétique des matériaux liquides, apportant ainsi une contribution significative au domaine de la recherche.

Théses de Doctorat

Browse

Filters

Settings

Sort By

Results per page

Search Results