Theme standard avec habillage graphique Thème malvoyant contrasté noir sur fond blanc Thème malvoyant contrasté blanc sur fond noir

La technologie a travers la machine a lire

Les années passent et la technologie ne cesse pas de nous étonner. Il n’y avait aucune raison que ce phénomène ne touche pas le public déficient visuel.

Si l’on devait effectuer une comparaison, la télé agrandisseur (pour en savoir davantage sur la télé agrandisseur, voir notre article du magazine du mois de décembre) correspondrait à notre bonne vieille télé à tube cathodique. Il est vrai que dans les années 80 et 90 elle faisait le bonheur de tous, mais force est de constater qu’elle n’est plus dans l’air du temps. Ces « ancêtres » ont été dépassés par la mise sur le marché des nouveaux Plasmas et autres LCD à écrans plats.

Il en va de même avec les télés agrandisseurs. Leur utilisation est devenue bien trop inconfortable dans une époque où la tendance est à la miniaturisation. C’est ainsi que sont apparus les premiers concepts de machines à lire reléguant le bon vieux braille sur le banc de touche.

Le premier prototype a été crée par le laboratoire Haskins en 1970. Le but de cette machine automatisée est de décoder le texte imprimé, peu importe le support, pour le retranscrire par le biais d’un dispositif de reconnaissance optique de caractère (OCR), puis de le restituer au moyen d’une synthèse vocale, afin de le rendre accessible aux déficients visuels.

Qu’est-ce que l’ORC ?

Un système ORC part de l'image numérique réalisée par un scanner optique d'une page (document imprimé, feuillet dactylographié, etc.), et produit en sortie un fichier texte qui peut être en différents formats (texte simple, formats de traitements de texte, XML...).

Certains logiciels tentent de conserver l'enrichissement du texte (corps, graisse et police) ainsi que la mise en page, voire de rebâtir les tableaux et d'extraire les images.

Certains logiciels comportent, en outre, une interface pour l'acquisition numérique de l'image.

Jusqu'à une date récente, le fonctionnement des systèmes ROC performants était peu connu car protégé par le secret industriel. Les logiciels open-source disponibles (ex: GOcr) étaient plutôt l'œuvre d'amateurs. La mise en open-source de systèmes performants (en particulier Tesseract en 2006) a quelque peu changé cette situation.

Les étapes de traitement peuvent être schématisées ainsi :

  • 1. Pré-analyse de l'image : le but est d'améliorer éventuellement la qualité de l'image. Ceci peut inclure le redressement d'images inclinées ou déformées, des corrections de contraste, le passage en mode bicolore ("noir et blanc" ou plutôt papier et encre), la détection de contours.
  • 2. Segmentation en lignes et en caractères (ou Analyse de page) : vise à isoler dans l'image les lignes de texte et les caractères à l'intérieur des lignes. Éventuellement aussi à détecter le texte souligné, les cadres, les images.
  • 3. Reconnaissance proprement dite des caractères: après normalisation (échelle, inclinaison), une instance à reconnaitre est comparée à une "bibliothèque" de formes connues, et on retient pour l'étape suivante la forme la plus "proche" (ou les formes les plus proches), avec un score ou une distance. Les techniques de reconnaissance se classent en quelques grands types:
    • a. Classification par Caractéristiques (Features) : une forme est représentée par un vecteur de valeurs numériques - appelées Features en anglais - calculées â partir de cette forme. Si les Features sont bien choisies, une classe de caractères (par exemple l'ensemble des A majuscule) sera représentée par un "nuage" contigu de points dans un espace vectoriel ayant un grand nombre de dimensions (le nombre de Features, typiquement 100 à 300). Le rôle du classificateur est de déterminer à quel nuage (donc à quelle classe de caractères) la forme à reconnaitre appartient le plus vraisemblablement. La classification fait généralement appel à divers types de réseaux de neurones artificiels entrainés sur de vastes bases de formes possibles.
    • b. Méthodes métriques : consistent à comparer directement la forme à reconnaitre, au moyen d'algorithmes de distance, avec un ensemble de modèles appris. Ce type de méthode est peu utilisé et peu valorisé par les chercheurs, car plus naïf et vraisemblablement moins efficace que les méthodes à base de Features.
    • c. Méthodes statistiques : dans le domaine de la reconnaissance d'écriture manuscrite, il est fréquemment fait appel aux méthodes probabilistes/statistiques comme les Chaînes de Markov.
  • 4. Post-traitement utilisant des règles linguistiques et contextuelles pour réduire le nombre d'erreurs de reconnaissance: dictionnaires de mots, de syllabes, de trigrammes. Dans des systèmes industriels, des techniques spécialisées pour certaines zones de texte (noms, adresses postales) peuvent utiliser des bases de données pour éliminer les solutions incorrectes.
  • 5. Génération du format de sortie.

Tout l’intérêt réside dans l’autonomie pour la personne atteinte du handicap visuel. Grâce à cette machine, chacun apprend à être autonome sans la sollicitation d’un tiers.

L’utilisation de cet outil est tout ce qu’il existe de plus basique, à l’instar du matériel audio basique. L’utilisateur possède la possibilité de mettre le texte sur pause mais aussi de faire marche avant et arrière, de régler le volume sonore voire même d’épeler un mot.

La machine à lire Lyris de la societé Texte et Relief

Dorénavant tout type de document peut être lisible et ce, sans même avoir à apprendre le braille, ce qui est bien moins contraignant. Grâce à la machine à lire, un déficient visuel peut maintenant lire les horaires pour prendre son bus ou encore payer ses impôts.

Pour en apprendre davantage concernant sa commercialisation et ses tarifs, nous vous proposons de consulter les pages de Texte et Relief. L’entreprise y propose divers modèles de machines ainsi que leurs différentes caractéristiques.

David Ferreira