Résumé:
Au cours des dernières décennies, la reconnaissance des scripteurs a été l’un des domaines de recherche les plus difficiles et fascinants dans le domaine de la reconnaissance des individus. Elle se divise en deux catégories : la vérification et l’identification du scripteur. Alors que la vérification du scripteur confirme l’identité de ce dernier, l’identification vise à l’identifier à partir des caractéristiques de l’écriture. Plusieurs applications sont concernées, telles que la criminalistique et l’analyse des documents historiques. Cependant, dans de nombreux scénarios, la disponibilité limitées des données mène à l’exploration d’approches alternatives. L’une des approches consiste à concevoir des systèmes à partir de fragments de textes manuscrits, ce qui présente des défis importants en raison de la variabilité des styles d’écriture et la quantité limitée de données pour concevoir un système robuste. Ces systèmes comprennent deux modules principales : la génération de caractéristiques et la classification. Les méthodes traditionnelles de génération de caractéristiques reposent sur des caractéristiques conçues manuellement et des connaissances d’experts, tandis que les progrès récents utilisent des techniques d’apprentissage profond pour l’extraction des caractéristiques et la classification. Malheureusement, dans plusieurs cas, ces systèmes sont lourds, dépendants de l’auteur et de la langue, et nécessitent une forte intensité de calcul. En outre, ils sont généralement fermés, ce qui signifie la nécessité d’un nouvel entraînement lors de l’ajout d’un nouveau scripteur au système. Par conséquent, la conception d’un système ouvert formé sur un petit sous-ensemble de scripteurs est une alternative intéressante pour l’identification des scripteurs. L’objectif de cette thèse est d’explorer diverses stratégies pour identifier un scripteur à partir de fragments de texte manuscrits en utilisant des systèmes d’apprentissage profond. Tous les systèmes proposés sont formés à partir de zéro et conçus en considérant deux tâches majeures : ouvertes et légères. Les principales contributions sont résumées ci-dessous : • Aborder la lourdeur des systèmes existants en proposant des méthodes légères d’apprentissage profond basées sur la classification en utilisant le réseau de neurones convolutif (CNN) comme extracteur de caractéristiques à partir de fragments de texte manuscrits. • L’utilisation d’autoencodeur convolutif (CAE) léger pour l’extraction de caractéristiques à partir de fragments de textes manuscrits afin de générer des caractéristiques indépendantes de l’auteur. En outre, l’introduction d’une nouvelle mesure pour évaluer l’efficacité des vecteurs de caractéristiques. • Explorer l’indépendance linguistique des scripteurs et la langue d’apprentissage en vue d’une généralisation à travers les ensembles de données et les styles d’écriture sur des documents contemporains et historiques. Toutes les expériences sont menées sur plusieurs ensembles de données de référence, à savoir IFN/ENIT, IAM, ICDAR 2017 et WAHD.