+ 86-755-29031883

Які програми OCR функції портативного терміналу КПК?

Що таке технологія OCR?

Оптичне розпізнавання символів (англ. Optical Character Recognition, OCR) відноситься до процесу аналізу та розпізнавання файлів зображень текстових матеріалів для отримання інформації про текст і макет.

Подібно до технології розпізнавання зображень і машинного зору, процес обробки в технології OCR також поділяється на введення, попередню обробку, проміжну обробку, постобробку та процес виведення.

введіть
Для різних форматів зображень існують різні формати зберігання та різні методи стиснення.Зараз існують OpenCV, CxImage тощо.

Попередня обробка – бінаризація

Більшість знімків, зроблених сьогодні цифровими камерами, є кольоровими зображеннями, які містять величезну кількість інформації та не підходять для технології OCR.

За змістом зображення ми можемо просто розділити його на передній і задній плани.Щоб зробити комп’ютер швидшим і краще виконувати обчислення, пов’язані з OCR, нам потрібно спочатку обробити кольорове зображення, щоб на зображенні залишалася лише інформація переднього плану та інформація фону.Бінаризацію також можна просто розуміти як «чорно-біле».

зменшення шуму зображення
Для різних зображень визначення шуму може бути різним, і процес зменшення шуму відповідно до характеристик шуму називається шумозаглушенням.

корекція нахилу
Оскільки звичайним користувачам під час фотографування документів важко зробити зйомку повністю відповідно до горизонтального та вертикального вирівнювання, тому зроблені знімки неминуче будуть перекошеними, для виправлення яких потрібне програмне забезпечення для обробки зображень.

Проміжна обробка – аналіз макета
Процес поділу зображень документа на абзаци та гілки називається аналізом макета.Через різноманітність і складність фактичних документів цей крок ще потребує оптимізації.

вирізання символів
Через обмеження умов фотографування та письма символи часто застрягають, а ручки ламаються.Пряме використання таких зображень для аналізу OCR значно обмежить продуктивність OCR.Тому потрібна сегментація символів, тобто розділення різних символів.

Розпізнавання персонажів
На ранньому етапі в основному використовувалося зіставлення шаблонів, а на пізнішому етапі в основному використовувалося вилучення ознак.Через вплив таких факторів, як зміщення тексту, товщина штриха, зламане перо, адгезія, обертання тощо, складність виділення ознак значно погіршується.

Відновлення макета
Люди сподіваються, що розпізнаний текст все ще впорядкований як оригінальне зображення документа, а абзаци, позиції та порядок виводяться в документи Word, PDF-документи тощо, і цей процес називається відновленням макета.

подальша обробка
Відповідно до співвідношення конкретного мовного контексту результат розпізнавання коригується.

вихід
Виведіть розпізнані символи як текст у певному форматі.

Яке застосування кишенькових терміналів на основі технології OCR?

За допомогою портативного терміналу КПК, завантаженого програмним забезпеченням для розпізнавання символів OCR, можна реалізувати багато прикладних програм, таких як: розпізнавання автомобільних номерних знаків, розпізнавання номерів контейнерів, розпізнавання етикеток ваги імпортованої яловичини та баранини, розпізнавання машинозчитуваної зони паспорта, розпізнавання показань електролічильників , сталева котушка Розпізнавання розпилених символів.


Час публікації: 16 листопада 2022 р
Онлайн-чат WhatsApp!