+ 86-755-29031883

Quines són les aplicacions de la funció PDA del terminal portàtil OCR?

Què és la tecnologia OCR?

El reconeixement òptic de caràcters (anglès: Optical Character Recognition, OCR) es refereix al procés d'anàlisi i reconeixement de fitxers d'imatge de materials de text per obtenir informació de text i maquetació.

De manera similar a la tecnologia de reconeixement d'imatges i visió artificial, el procés de processament de la tecnologia OCR també es divideix en processos d'entrada, preprocessament, processament a mig termini, postprocessament i sortida.

entrar
Per a diferents formats d'imatge, hi ha diferents formats d'emmagatzematge i diferents mètodes de compressió.Actualment, hi ha OpenCV, CxImage, etc.

Preprocessament – ​​binarització

La majoria de les imatges preses per les càmeres digitals actuals són imatges en color, que contenen una gran quantitat d'informació i no són adequades per a la tecnologia OCR.

Per al contingut de la imatge, simplement podem dividir-la en primer pla i fons.Per tal que l'ordinador sigui més ràpid i realitzi millor els càlculs relacionats amb l'OCR, primer hem de processar la imatge en color, de manera que només quedin a la imatge la informació de primer pla i la informació de fons.La binarització també es pot entendre simplement com a "blanc i negre".

reducció del soroll de la imatge
Per a diferents imatges, la definició de soroll pot ser diferent i el procés de reducció de soroll segons les característiques del soroll s'anomena reducció de soroll.

correcció d'inclinació
Com que els usuaris normals, quan fan fotos de documents, és difícil disparar completament en línia amb l'alineació horitzontal i vertical, de manera que les imatges preses seran inevitablement esbiaixades, la qual cosa requereix un programari de processament d'imatges per corregir.

Processament a mig termini: anàlisi de maquetació
El procés de dividir imatges de documents en paràgrafs i branques s'anomena anàlisi de maquetació.A causa de la diversitat i la complexitat dels documents reals, aquest pas encara s'ha d'optimitzar.

tall de caràcters
A causa de les limitacions de les condicions de fotografia i escriptura, els caràcters sovint s'enganxen i els llapis es trenquen.L'ús directe d'aquestes imatges per a l'anàlisi OCR limitarà molt el rendiment de l'OCR.Per tant, és necessària la segmentació de caràcters, és a dir, separar diferents caràcters.

Reconeixement de caràcters
En l'etapa inicial, es va utilitzar principalment la concordança de plantilles i, en la fase posterior, es va utilitzar principalment l'extracció de característiques.A causa de la influència de factors com ara el desplaçament del text, el gruix del traç, el llapis trencat, l'adhesió, la rotació, etc., la dificultat d'extracció de característiques es veu molt afectada.

Restauració de maquetació
La gent espera que el text reconegut encara estigui organitzat com la imatge del document original, i els paràgrafs, les posicions i l'ordre s'enviïn a documents de Word, documents PDF, etc., i aquest procés s'anomena restauració del disseny.

processament posterior
Segons la relació del context lingüístic específic, el resultat del reconeixement es corregeix.

sortida
Emet els caràcters reconeguts com a text en un format determinat.

Quines són les aplicacions dels terminals portàtils basats en la tecnologia OCR?

A través del terminal portàtil PDA carregat amb programari de reconeixement de caràcters OCR, es poden realitzar moltes aplicacions d'escena, com ara: reconeixement de matrícules d'automòbils, reconeixement de números de contenidors, reconeixement d'etiquetes de pes de vedella i xai importats, reconeixement d'àrea llegible per màquina del passaport, reconeixement de lectura de comptador elèctric. , bobina d'acer Reconeixement de caràcters ruixats.


Hora de publicació: 16-nov-2022
Xat en línia de WhatsApp!