+ 86-755-29031883

Quelles sont les applications de la fonction PDA du terminal portable OCR ?

Qu'est-ce que la technologie OCR ?

La reconnaissance optique de caractères (en anglais : Optical Character Recognition, OCR) fait référence au processus d'analyse et de reconnaissance de fichiers d'images de documents textuels pour obtenir des informations sur le texte et la mise en page.

Semblable à la reconnaissance d'image et à la technologie de vision industrielle, le processus de traitement de la technologie OCR est également divisé en processus d'entrée, de prétraitement, de traitement à mi-parcours, de post-traitement et de sortie.

entrer
Pour différents formats d'image, il existe différents formats de stockage et différentes méthodes de compression.Actuellement, il existe OpenCV, CxImage, etc.

Pré-traitement – ​​binarisation

La plupart des photos prises par les appareils photo numériques aujourd'hui sont des images couleur, qui contiennent une énorme quantité d'informations et ne sont pas adaptées à la technologie OCR.

Pour le contenu de l'image, nous pouvons simplement la diviser en premier plan et arrière-plan.Afin de rendre l'ordinateur plus rapide et de mieux effectuer les calculs liés à l'OCR, nous devons d'abord traiter l'image couleur, de sorte que seules les informations de premier plan et les informations d'arrière-plan restent dans l'image.La binarisation peut aussi être simplement comprise comme « noir et blanc ».

réduction du bruit des images
Pour différentes images, la définition du bruit peut être différente et le processus de débruitage en fonction des caractéristiques du bruit est appelé réduction du bruit.

correction d'inclinaison
Parce que les utilisateurs ordinaires, lorsqu'ils prennent des photos de documents, il est difficile de prendre des photos complètement alignées avec l'alignement horizontal et vertical, de sorte que les photos prises seront inévitablement faussées, ce qui nécessite un logiciel de traitement d'image pour corriger.

Traitement à mi-parcours - analyse de la mise en page
Le processus de division des images de document en paragraphes et en branches s'appelle l'analyse de la mise en page.En raison de la diversité et de la complexité des documents réels, cette étape doit encore être optimisée.

découpe de personnage
En raison des limites des conditions de photographie et d'écriture, les caractères sont souvent coincés et les stylos sont cassés.L'utilisation directe de ces images pour l'analyse OCR limitera considérablement les performances de l'OCR.Par conséquent, la segmentation des caractères est nécessaire, c'est-à-dire pour séparer différents caractères.

Reconnaissance de caractères
Au début, l'appariement de modèles était principalement utilisé, et au stade ultérieur, l'extraction de caractéristiques était principalement utilisée.En raison de l'influence de facteurs tels que le déplacement du texte, l'épaisseur du trait, le stylet cassé, l'adhérence, la rotation, etc., la difficulté d'extraction des caractéristiques est grandement affectée.

Restauration de la mise en page
Les gens espèrent que le texte reconnu est toujours organisé comme l'image du document d'origine, et que les paragraphes, les positions et l'ordre sont sortis dans des documents Word, des documents PDF, etc., et ce processus est appelé restauration de la mise en page.

post-traitement
Selon la relation du contexte linguistique spécifique, le résultat de la reconnaissance est corrigé.

sortir
Sortez les caractères reconnus sous forme de texte dans un certain format.

Quelles sont les applications des terminaux portables basés sur la technologie OCR ?

Grâce au terminal portable PDA chargé d'un logiciel de reconnaissance de caractères OCR, de nombreuses applications de scène peuvent être réalisées, telles que : reconnaissance de plaque d'immatriculation de voiture, reconnaissance de numéro de conteneur, reconnaissance d'étiquette de poids de bœuf et de mouton importés, reconnaissance de zone lisible par machine de passeport, reconnaissance de lecture de compteur électrique , bobine en acier Reconnaissance des caractères pulvérisés.


Heure de publication : 16 novembre 2022
Chat en ligne WhatsApp !