+ 86-755-29031883

Quais são as aplicações da função PDA do terminal portátil OCR?

O que é a tecnologia OCR?

Reconhecimento óptico de caracteres (inglês: Reconhecimento óptico de caracteres, OCR) refere-se ao processo de análise e reconhecimento de arquivos de imagem de materiais de texto para obter informações de texto e layout.

Semelhante ao reconhecimento de imagem e tecnologia de visão de máquina, o processo de processamento da tecnologia OCR também é dividido em entrada, pré-processamento, processamento intermediário, pós-processamento e processo de saída.

digitar
Para diferentes formatos de imagem, existem diferentes formatos de armazenamento e diferentes métodos de compactação.Atualmente, existem OpenCV, CxImage, etc.

Pré-processamento – binarização

A maioria das fotos tiradas por câmeras digitais hoje são imagens coloridas, que contêm uma grande quantidade de informações e não são adequadas para a tecnologia OCR.

Para o conteúdo da imagem, podemos simplesmente dividi-la em primeiro plano e plano de fundo.Para tornar o computador mais rápido e executar melhor os cálculos relacionados ao OCR, precisamos processar primeiro a imagem colorida, de modo que apenas as informações do primeiro plano e as informações do plano de fundo permaneçam na imagem.A binarização também pode ser simplesmente entendida como “preto e branco”.

redução de ruído de imagem
Para imagens diferentes, a definição de ruído pode ser diferente, e o processo de remoção de ruído de acordo com as características do ruído é chamado de redução de ruído.

correção de inclinação
Como os usuários comuns, ao tirar fotos de documentos, é difícil fotografar completamente alinhados com o alinhamento horizontal e vertical, as fotos tiradas inevitavelmente ficarão distorcidas, o que requer um software de processamento de imagem para corrigir.

Processamento intermediário - análise de layout
O processo de dividir imagens de documentos em parágrafos e ramificações é chamado de análise de layout.Devido à diversidade e complexidade dos documentos reais, esta etapa ainda precisa ser otimizada.

corte de personagem
Devido às limitações das condições de fotografia e escrita, os personagens muitas vezes ficam presos e as canetas quebradas.O uso direto dessas imagens para análise de OCR limitará bastante o desempenho do OCR.Portanto, é necessária a segmentação de caracteres, ou seja, separar caracteres diferentes.

Reconhecimento de caracteres
No estágio inicial, a correspondência de modelos foi usada principalmente e, no estágio posterior, a extração de recursos foi usada principalmente.Devido à influência de fatores como deslocamento do texto, espessura do traço, caneta quebrada, adesão, rotação, etc., a dificuldade de extração de recursos é bastante afetada.

restauração de layout
As pessoas esperam que o texto reconhecido ainda esteja organizado como a imagem do documento original, e os parágrafos, posições e ordem sejam enviados para documentos do Word, documentos PDF, etc., e esse processo é chamado de restauração de layout.

pós-processamento
De acordo com a relação do contexto de linguagem específico, o resultado do reconhecimento é corrigido.

saída
Emita os caracteres reconhecidos como texto em um determinado formato.

Quais são as aplicações dos terminais portáteis baseados na tecnologia OCR?

Através do PDA do terminal portátil carregado com o software de reconhecimento de caracteres OCR, muitas aplicações de cena podem ser realizadas, tais como: reconhecimento de placa de carro, reconhecimento de número de contêiner, reconhecimento de etiqueta de peso de carne bovina e ovina importada, reconhecimento de área legível por máquina de passaporte, reconhecimento de leitura de medidor elétrico , bobina de aço Reconhecimento de caracteres pulverizados.


Horário de postagem: 16 de novembro de 2022
Bate-papo on-line do WhatsApp!