+ 86-755-29031883

Millised on OCR-pihuterminali PDA funktsiooni rakendused?

Mis on OCR-tehnoloogia?

Optiline märgituvastus (inglise keeles: Optical Character Recognition, OCR) viitab tekstimaterjalide pildifailide analüüsimise ja äratundmise protsessile, et saada teksti- ja paigutusteavet.

Sarnaselt pildituvastus- ja masinnägemistehnoloogiale jaguneb ka OCR-tehnoloogia töötlemisprotsess sisend-, eeltöötlus-, vahetöötlus-, järeltöötlus- ja väljundprotsessiks.

sisenema
Erinevate pildivormingute jaoks on erinevad salvestusvormingud ja erinevad tihendusmeetodid.Praegu on olemas OpenCV, CxImage jne.

Eeltöötlus – binariseerimine

Suurem osa digikaameratega tehtud piltidest on tänapäeval värvilised pildid, mis sisaldavad tohutul hulgal informatsiooni ega sobi OCR-tehnoloogiaga.

Pildi sisu jaoks võime selle lihtsalt jagada esiplaaniks ja taustaks.Arvuti kiiremaks muutmiseks ja OCR-iga seotud arvutuste paremaks sooritamiseks peame esmalt töötlema värvilise pildi, nii et pildile jääks ainult esiplaani informatsioon ja taustainfo.Binariseerimist võib mõista ka lihtsalt kui “must ja valget”.

pildi müra vähendamine
Erinevate piltide puhul võib müra definitsioon olla erinev ja müra tunnustele vastavat müra vähendamise protsessi nimetatakse müra vähendamiseks.

kalde korrigeerimine
Kuna tavakasutajatel on dokumente pildistades keeruline horisontaalse ja vertikaalse joondusega täiesti ühtlast pildistada, mistõttu jäävad tehtud pildid paratamatult viltu, mille parandamiseks on vaja pilditöötlustarkvara.

Vahetöötlus – küljendusanalüüs
Dokumendi piltide lõikudeks ja harudeks jagamise protsessi nimetatakse paigutusanalüüsiks.Tegelike dokumentide mitmekesisuse ja keerukuse tõttu vajab see samm veel optimeerimist.

iseloomu lõikamine
Pildistamis- ja kirjutamistingimuste piiratuse tõttu jäävad tegelased sageli ummikusse ja pliiatsid katki.Selliste piltide otsene kasutamine OCR-analüüsiks piirab oluliselt OCR-i jõudlust.Seetõttu on vajalik märkide segmenteerimine, st erinevate märkide eraldamine.

Tegelaste äratundmine
Algstaadiumis kasutati peamiselt mallide sobitamist ja hilisemas staadiumis funktsioonide väljavõtmist.Selliste tegurite mõju tõttu nagu teksti nihkumine, joone paksus, katkine pliiats, haardumine, pöörlemine jne mõjutavad funktsioonide eraldamise raskused oluliselt.

Paigutuse taastamine
Inimesed loodavad, et tuvastatud tekst on endiselt paigutatud nagu originaaldokumendi pilt ning lõigud, positsioonid ja järjekord väljastatakse Wordi dokumentidesse, PDF-dokumentidesse jne ning seda protsessi nimetatakse paigutuse taastamiseks.

järeltöötlus
Vastavalt konkreetse keelekonteksti suhtele parandatakse äratundmistulemust.

väljund
Väljastage tuvastatud märgid tekstina teatud vormingus.

Millised on OCR-tehnoloogial põhinevate pihuterminalide rakendused?

OCR-i märgituvastustarkvaraga laetud pihuterminali PDA kaudu saab realiseerida paljusid stseenirakendusi, näiteks: auto numbrimärgituvastus, konteineri numbrituvastus, imporditud veise- ja lambaliha kaalusiltide tuvastamine, passi masinloetava ala tuvastamine, elektriarvesti näidu tuvastamine. , teraspool Pritsitud tegelaste äratundmine.


Postitusaeg: 16.11.2022
WhatsAppi veebivestlus!