+ 86-755-29031883

OCR qo'l terminali PDA funksiyasining ilovalari qanday?

OCR texnologiyasi nima?

Optical Character Recognition (inglizcha: Optical Character Recognition, OCR) matn va joylashuv maʼlumotlarini olish uchun matn materiallarining tasvir fayllarini tahlil qilish va tanib olish jarayonini bildiradi.

Tasvirni aniqlash va mashinani ko'rish texnologiyasiga o'xshab, OCR texnologiyasini qayta ishlash jarayoni ham kirish, dastlabki ishlov berish, o'rta muddatli ishlov berish, keyingi ishlov berish va chiqish jarayoniga bo'linadi.

kiriting
Turli xil tasvir formatlari uchun turli xil saqlash formatlari va turli xil siqish usullari mavjud.Hozirda OpenCV, CxImage va boshqalar mavjud.

Oldindan ishlov berish - binarizatsiya

Bugungi kunda raqamli kameralar tomonidan olingan rasmlarning aksariyati rangli tasvirlar bo'lib, ular juda katta hajmdagi ma'lumotlarni o'z ichiga oladi va OCR texnologiyasiga mos kelmaydi.

Rasmning mazmuni uchun biz uni oddiygina old va fonga ajratishimiz mumkin.Kompyuterni OCR bilan bog'liq hisob-kitoblarni tezroq va yaxshiroq bajarish uchun biz avval rangli tasvirni qayta ishlashimiz kerak, shunda rasmda faqat oldingi ma'lumotlar va fon ma'lumotlari qoladi.Binarizatsiyani oddiygina "qora va oq" deb ham tushunish mumkin.

tasvir shovqinini kamaytirish
Turli xil tasvirlar uchun shovqinning ta'rifi boshqacha bo'lishi mumkin va shovqinning xususiyatlariga ko'ra denozizatsiya jarayoni shovqinni kamaytirish deb ataladi.

egilishni tuzatish
Chunki oddiy foydalanuvchilar hujjatlarni suratga olishda gorizontal va vertikal tekislash bilan to‘liq mos ravishda suratga olish qiyin, shuning uchun olingan suratlar muqarrar ravishda qiyshayib qoladi, bu esa tuzatish uchun tasvirni qayta ishlash dasturini talab qiladi.

O'rta muddatli ishlov berish - tartibni tahlil qilish
Hujjat rasmlarini paragraflar va filiallarga bo'lish jarayoni tartib tahlili deb ataladi.Haqiqiy hujjatlarning xilma-xilligi va murakkabligi tufayli ushbu bosqich hali ham optimallashtirilishi kerak.

belgilarni kesish
Suratga olish va yozish shartlarining cheklovlari tufayli belgilar ko'pincha tiqilib qoladi va qalamlar buziladi.OCR tahlili uchun bunday tasvirlardan bevosita foydalanish OCR ish faoliyatini sezilarli darajada cheklaydi.Shuning uchun belgilar segmentatsiyasi, ya'ni turli belgilarni ajratish talab qilinadi.

Xarakterni tanib olish
Dastlabki bosqichda, asosan, shablonni moslashtirish, keyingi bosqichda esa, asosan, xususiyatni ajratib olish qo'llanilgan.Matnni siljitish, chiziq qalinligi, singan qalam, yopishish, aylanish va boshqalar kabi omillarning ta'siri tufayli xususiyatni ajratib olish qiyinligi katta ta'sir ko'rsatadi.

Tartibni tiklash
Odamlar tan olingan matn hali ham asl hujjat rasmi kabi tartibga solinishiga umid qiladilar va paragraflar, pozitsiyalar va tartib Word hujjatlari, PDF hujjatlari va boshqalarga chiqariladi va bu jarayon tartibni tiklash deb ataladi.

keyingi ishlov berish
Muayyan til kontekstining munosabatiga ko'ra, tan olish natijasi tuzatiladi.

chiqish
Belgilangan belgilarni ma'lum formatda matn sifatida chiqaring.

OCR texnologiyasiga asoslangan portativ terminallarning qo'llanilishi qanday?

OCR belgilarni aniqlash dasturiy ta'minoti o'rnatilgan qo'l terminali PDA orqali ko'plab sahna dasturlarini amalga oshirish mumkin, masalan: avtomobil raqamini aniqlash, konteyner raqamini aniqlash, import qilingan mol go'shti va qo'y go'shti vazni yorlig'ini aniqlash, pasport mashinasida o'qiladigan hududni aniqlash, elektr hisoblagichni o'qishni aniqlash. , po'lat rulon Püskürtülmüş belgilarni tanib olish.


Yuborilgan vaqt: 2022 yil 16-noyabr
WhatsApp onlayn chat!