+ 86-755-29031883

Каковы приложения функции карманного терминала OCR PDA?

Что такое технология OCR?

Оптическое распознавание символов (англ. Optical Character Recognition, OCR) относится к процессу анализа и распознавания файлов изображений текстовых материалов для получения информации о тексте и макете.

Подобно технологии распознавания изображений и машинного зрения, процесс обработки технологии OCR также делится на процесс ввода, предварительной обработки, промежуточной обработки, постобработки и вывода.

входить
Для разных форматов изображений существуют разные форматы хранения и разные методы сжатия.В настоящее время существуют OpenCV, CxImage и т.д.

Предварительная обработка – бинаризация

Большинство снимков, сделанных сегодня цифровыми камерами, представляют собой цветные изображения, которые содержат огромное количество информации и не подходят для технологии OCR.

По содержанию изображения мы можем просто разделить его на передний план и фон.Чтобы компьютер быстрее и лучше выполнял вычисления, связанные с распознаванием символов, нам нужно сначала обработать цветное изображение, чтобы на изображении осталась только информация о переднем плане и информация о фоне.Бинаризация также может быть понята просто как «черно-белая».

шумоподавление изображения
Для разных изображений определение шума может быть разным, а процесс шумоподавления по характеристикам шума называется шумоподавлением.

коррекция наклона
Поскольку обычным пользователям при фотографировании документов сложно снимать полностью в соответствии с горизонтальным и вертикальным выравниванием, поэтому сделанные снимки неизбежно будут перекошены, для исправления которых требуется программное обеспечение для обработки изображений.

Среднесрочная обработка – анализ макета
Процесс разделения изображений документа на абзацы и ветви называется анализом макета.Из-за разнообразия и сложности фактических документов этот шаг все еще нуждается в оптимизации.

вырезание персонажей
Из-за ограничений условий фотографирования и письма символы часто застревают, а ручки ломаются.Непосредственное использование таких изображений для анализа OCR значительно ограничит производительность OCR.Поэтому требуется сегментация символов, то есть разделение разных символов.

Распознавание символов
На раннем этапе в основном использовалось сопоставление с шаблоном, а на более позднем этапе в основном использовалось извлечение признаков.Из-за влияния таких факторов, как смещение текста, толщина штриха, сломанное перо, слипание, вращение и т. д., сложность извлечения признаков сильно зависит.

Восстановление макета
Люди надеются, что распознанный текст по-прежнему упорядочен как исходное изображение документа, а абзацы, позиции и порядок выводятся в документы Word, PDF-документы и т. д., и этот процесс называется восстановлением макета.

Постобработка
В зависимости от связи конкретного языкового контекста корректируется результат распознавания.

выход
Вывод распознанных символов в виде текста в определенном формате.

Каковы области применения портативных терминалов на основе технологии OCR?

С помощью портативного терминала PDA, загруженного программным обеспечением для распознавания символов OCR, можно реализовать множество сценических приложений, таких как: распознавание номерных знаков автомобилей, распознавание номеров контейнеров, распознавание весовых этикеток импортной говядины и баранины, распознавание машиночитаемой области паспорта, распознавание показаний электросчетчика. , стальная катушка Распознавание напыленных символов.


Время публикации: 16 ноября 2022 г.
Онлайн чат WhatsApp!