Écrit par Ana Canteli le 6 mai 2022
L'origine de la reconnaissance optique de caractères remonte au début du XXe siècle, lorsque, en 1914, Emanuel Goldberg développa une machine capable de lire et de convertir des caractères en code télégraphique standard. Cependant, ce n’est qu’en 1974 que les avancées notables de Ray Kurzweil permirent de reconnaître optiquement les caractères imprimés, indépendamment de la police de caractères, dans le but de créer une machine à lire pour les personnes aveugles ou malvoyantes.
Cette origine anecdotique et le développement prolongé dans le temps, avec des objectifs disparates, ont abouti à une technologie révolutionnaire telle que l’OCR Zonal. Elle est actuellement intégrée dans les smartphones, lunettes intelligentes et appareils connectés à Internet capables de lire du texte grâce à leurs caméras. Alors qu’elle était initialement conçue pour améliorer l’accessibilité à l’information des personnes ayant des besoins spécifiques, elle est aujourd’hui massivement utilisée pour accroître les avantages et améliorer l’efficacité des processus organisationnels à l’échelle mondiale.
Si vous avez déjà utilisé une application sur votre mobile qui traduit automatiquement les panneaux écrits dans une langue étrangère, alors cette application utilise l’OCR Zonal. Ni la typographie ni la langue ne constituent aujourd’hui une limite, et les conditions d’éclairage ou de résolution ne doivent plus être optimales.
Depuis ses débuts, la technologie de reconnaissance optique de caractères (OCR) est devenue une solution commerciale utilisée pour automatiser l’extraction de données — à partir de texte imprimé ou d’une image scannée d’un document — afin de la rendre lisible par un ordinateur. Ainsi, les données obtenues deviennent utiles pour les utilisateurs, qui peuvent les rechercher ou les modifier.
Le système de gestion documentaire OpenKM comprend un moteur OCR (Tesseract ou Cuneiform) pour élargir les cas d’usage et étendre les fonctionnalités logicielles requises par l’organisation.
La reconnaissance optique de caractères est souvent une technologie cachée derrière de nombreux processus métiers, alimentant divers services quotidiennement. La capacité à extraire du texte imprimé d’une image numérique n’est qu’un aspect de la capture de données. Le logiciel de gestion documentaire OpenKM peut extraire du texte à partir de divers formats : écriture manuscrite (ICR), cases à cocher (OMR), codes-barres, etc. Le système OCR d’OpenKM fonctionne avec des plugins pour s’adapter à la lecture des données requises : texte, chiffres, codes alphanumériques, codes-barres de tout type, etc.
Un autre usage courant de l’OCR est la conversion automatique d’un fichier image (jpg, jpeg, png, BMP) en PDF, afin d’en garantir une meilleure utilisabilité et neutralité de format. De nombreux documents comme les contrats, reçus, factures et relevés bancaires peuvent être ainsi traités.
Une société de location de voitures souhaite contrôler en temps réel l’état de chaque opération de location. Elle possède de nombreux bureaux à travers le pays et stocke des informations essentielles dans une base de données tierce.
Plusieurs modèles OCR ont été créés pour gérer la documentation liée à la location de véhicules. L’un d’eux est le modèle « certificat d’immatriculation ».
L’OCR zonal standard intégré dans OpenKM est utilisé pour capturer des informations apparaissant toujours au même endroit avec les mêmes caractéristiques. Dans ce cas, lorsqu’un numéro de plaque est détecté à un endroit spécifique et un numéro de châssis à un autre, OpenKM sait qu’il s’agit d’un « certificat d’immatriculation ». C’est une information que l’administrateur doit prendre en compte.
Un utilisateur standard, employé de bureau, doit scanner les documents obligatoires pour louer un véhicule, y compris le certificat d’immatriculation. Le chemin automatique commence dans le dossier automatisé « Scanner ». L’employé en charge du client a terminé sa tâche.
Imaginons maintenant que nous soyons un autre employé, du service client. Nous recevons un appel. Pour effectuer notre tâche, nous utilisons le moteur de recherche OpenKM. Dans l’onglet avancé, nous recherchons les documents par métadonnées en choisissant le groupe de métadonnées « Numéro de plaque ». Nous devons d’abord savoir si la personne qui appelle est un client. La communication est difficile, mais nous parvenons à entendre les deux premiers chiffres de la plaque. OpenKM nous montre un certificat d’immatriculation dans les résultats : nous pouvons poursuivre le service.
En cliquant sur « Afficher les groupes de métadonnées », nous voyons comment OpenKM a géré la documentation dans ce cas.
Il a renommé le document avec les attributs importants pour l’entreprise : la plaque et le type de document (au lieu d’un code automatique à l’entrée). Il a également converti le fichier en PDF pour garantir un accès à long terme à l’information.
En parallèle, il a lié plus d’informations au document. Le groupe de métadonnées inclut maintenant la plaque, le numéro de châssis, et le type de document — informations issues de l’OCR. La date, la marque, le modèle et le numéro fiscal du véhicule proviennent d’une base de données intégrée à OpenKM.
Et le plus important : où se trouve ce document ? Le moteur de recherche du logiciel nous dirige vers l’emplacement du fichier, classé automatiquement sous le nom du bureau ayant géré l’opération, et accompagné des métadonnées ajoutées automatiquement par OpenKM.
Le système de gestion documentaire OpenKM peut s’adapter à tout scénario. Si vous souhaitez découvrir comment mettre en œuvre les améliorations offertes par la reconnaissance optique de caractères, n’hésitez pas à nous contacter.