+ 86-755-29031883

Jakie są zastosowania funkcji PDA terminala ręcznego OCR?

Czym jest technologia OCR?

Optical Character Recognition (angielski: Optical Character Recognition, OCR) odnosi się do procesu analizy i rozpoznawania plików graficznych materiałów tekstowych w celu uzyskania informacji o tekście i układzie.

Podobnie jak w przypadku rozpoznawania obrazu i technologii widzenia maszynowego, proces przetwarzania technologii OCR jest również podzielony na przetwarzanie wejściowe, przetwarzanie wstępne, przetwarzanie średniookresowe, przetwarzanie końcowe i proces wyjściowy.

Wchodzić
W przypadku różnych formatów obrazu istnieją różne formaty przechowywania i różne metody kompresji.Obecnie istnieją OpenCV, CxImage itp.

Przetwarzanie wstępne – binaryzacja

Większość zdjęć robionych dziś aparatami cyfrowymi to obrazy kolorowe, które zawierają ogromną ilość informacji i nie nadają się do technologii OCR.

Ze względu na zawartość obrazu możemy po prostu podzielić go na pierwszy plan i tło.Aby komputer działał szybciej i lepiej wykonywał obliczenia związane z OCR, musimy najpierw przetworzyć kolorowy obraz, tak aby na obrazie pozostały tylko informacje pierwszego planu i informacje tła.Binaryzacja może być również rozumiana po prostu jako „czarno-biała”.

redukcja szumów obrazu
Dla różnych obrazów definicja szumu może być różna, a proces odszumiania zgodnie z charakterystyką szumu nazywany jest redukcją szumu.

korekcja pochylenia
Ponieważ zwykli użytkownicy podczas robienia zdjęć dokumentów trudno jest sfotografować całkowicie zgodnie z wyrównaniem poziomym i pionowym, więc zrobione zdjęcia będą nieuchronnie przekrzywione, co wymaga skorygowania oprogramowania do przetwarzania obrazu.

Przetwarzanie śródokresowe – analiza układu
Proces dzielenia obrazów dokumentu na akapity i gałęzie nazywany jest analizą układu.Ze względu na różnorodność i złożoność rzeczywistych dokumentów krok ten wymaga jeszcze optymalizacji.

wycinanie postaci
Ze względu na ograniczenia warunków fotografowania i pisania znaki często się zacinają, a długopisy łamią.Bezpośrednie użycie takich obrazów do analizy OCR znacznie ograniczy wydajność OCR.Dlatego wymagana jest segmentacja postaci, to znaczy oddzielenie różnych postaci.

Rozpoznawanie znaków
Na wczesnym etapie stosowano głównie dopasowywanie szablonów, aw późniejszym etapie wykorzystywano głównie ekstrakcję cech.Ze względu na wpływ czynników, takich jak przemieszczenie tekstu, grubość obrysu, złamany długopis, przyczepność, obrót itp., znacznie wpływa to na trudność wyodrębniania cech.

Przywrócenie układu
Ludzie mają nadzieję, że rozpoznany tekst jest nadal ułożony tak, jak oryginalny obraz dokumentu, a akapity, pozycje i kolejność są wyprowadzane do dokumentów Word, dokumentów PDF itp., a proces ten nazywa się przywracaniem układu.

przetwarzanie końcowe
Zgodnie z zależnością określonego kontekstu językowego wynik rozpoznawania jest korygowany.

wyjście
Wypisz rozpoznane znaki jako tekst w określonym formacie.

Jakie są zastosowania terminali ręcznych opartych na technologii OCR?

Za pomocą przenośnego terminala PDA wyposażonego w oprogramowanie do rozpoznawania znaków OCR można realizować wiele zastosowań sceny, takich jak: rozpoznawanie tablic rejestracyjnych samochodów, rozpoznawanie numeru kontenera, rozpoznawanie etykiet wagowych importowanej wołowiny i baraniny, rozpoznawanie obszaru odczytu maszynowego paszportu, rozpoznawanie odczytów liczników energii elektrycznej , cewka stalowa Rozpoznawanie znaków natryskowych.


Czas postu: 16 listopada 2022 r
Czat online WhatsApp!