+ 86-755-29031883

Welche Anwendungen bietet die PDA-Funktion des OCR-Handterminals?

Was ist OCR-Technologie?

Unter optischer Zeichenerkennung (englisch: Optical Character Recognition, OCR) versteht man den Prozess der Analyse und Erkennung von Bilddateien von Textmaterialien, um Text- und Layoutinformationen zu erhalten.

Ähnlich wie bei der Bilderkennung und der Bildverarbeitungstechnologie ist auch der Verarbeitungsprozess der OCR-Technologie in Eingabe-, Vorverarbeitungs-, Zwischenverarbeitungs-, Nachbearbeitungs- und Ausgabeprozesse unterteilt.

eingeben
Für unterschiedliche Bildformate gibt es unterschiedliche Speicherformate und unterschiedliche Komprimierungsmethoden.Derzeit gibt es OpenCV, CxImage usw.

Vorverarbeitung – Binarisierung

Die meisten Bilder, die heutzutage von Digitalkameras aufgenommen werden, sind Farbbilder, die eine große Menge an Informationen enthalten und nicht für die OCR-Technologie geeignet sind.

Für den Inhalt des Bildes können wir es einfach in Vordergrund und Hintergrund unterteilen.Um den Computer schneller zu machen und OCR-bezogene Berechnungen besser durchführen zu können, müssen wir zunächst das Farbbild verarbeiten, sodass nur die Vordergrund- und Hintergrundinformationen im Bild verbleiben.Binarisierung kann auch einfach als „Schwarz-Weiß“ verstanden werden.

Reduzierung des Bildrauschens
Für verschiedene Bilder kann die Definition von Rauschen unterschiedlich sein, und der Prozess der Rauschunterdrückung entsprechend den Rauscheigenschaften wird als Rauschunterdrückung bezeichnet.

Neigungskorrektur
Da es für normale Benutzer beim Fotografieren von Dokumenten schwierig ist, die horizontale und vertikale Ausrichtung vollständig auszurichten, werden die aufgenommenen Bilder unweigerlich verzerrt, was eine Korrektur durch Bildverarbeitungssoftware erfordert.

Mittelfristige Bearbeitung – Layoutanalyse
Der Vorgang der Aufteilung von Dokumentbildern in Absätze und Zweige wird als Layoutanalyse bezeichnet.Aufgrund der Vielfalt und Komplexität der tatsächlichen Dokumente muss dieser Schritt noch optimiert werden.

Charakterschneiden
Aufgrund der eingeschränkten Aufnahme- und Schreibbedingungen bleiben Zeichen oft hängen und Stifte sind kaputt.Die direkte Verwendung solcher Bilder für die OCR-Analyse schränkt die OCR-Leistung erheblich ein.Daher ist eine Zeichensegmentierung erforderlich, d. h. die Trennung verschiedener Zeichen.

Zeichenerkennung
In der frühen Phase wurde hauptsächlich der Vorlagenabgleich verwendet, und in der späteren Phase wurde hauptsächlich die Merkmalsextraktion verwendet.Aufgrund des Einflusses von Faktoren wie Textverschiebung, Strichstärke, gebrochenem Stift, Adhäsion, Drehung usw. wird die Schwierigkeit der Merkmalsextraktion stark beeinflusst.

Layout-Wiederherstellung
Man hofft, dass der erkannte Text immer noch wie das Originaldokumentbild angeordnet ist und die Absätze, Positionen und Reihenfolge in Word-Dokumente, PDF-Dokumente usw. ausgegeben werden. Dieser Vorgang wird als Layout-Wiederherstellung bezeichnet.

Nachbearbeitung
Entsprechend der Beziehung zum spezifischen Sprachkontext wird das Erkennungsergebnis korrigiert.

Ausgang
Geben Sie die erkannten Zeichen als Text in einem bestimmten Format aus.

Welche Einsatzmöglichkeiten bieten Handheld-Terminals auf Basis der OCR-Technologie?

Mit dem Handheld-Terminal-PDA, der mit OCR-Zeichenerkennungssoftware ausgestattet ist, können viele Szenenanwendungen realisiert werden, wie zum Beispiel: Erkennung von Kfz-Kennzeichen, Erkennung von Containernummern, Erkennung von Gewichtsetiketten für importiertes Rind- und Hammelfleisch, Erkennung von maschinenlesbaren Passbereichen, Erkennung von Stromzählerständen , Stahlspule Erkennung aufgesprühter Zeichen.


Zeitpunkt der Veröffentlichung: 16. November 2022
WhatsApp Online-Chat!