+ 86-755-29031883

OCR қол терминалының PDA функциясының қолданбалары қандай?

OCR технологиясы дегеніміз не?

Optical Character Recognition (ағылш. Optical Character Recognition, OCR) мәтін мен орналасу ақпаратын алу үшін мәтіндік материалдардың кескін файлдарын талдау және тану процесін білдіреді.

Кескінді тану және машинамен көру технологиясына ұқсас, OCR технологиясының өңдеу процесі де енгізу, алдын ала өңдеу, орта мерзімді өңдеу, кейінгі өңдеу және шығару процестеріне бөлінеді.

енгізіңіз
Әртүрлі кескін пішімдері үшін әртүрлі сақтау пішімдері және әртүрлі қысу әдістері бар.Қазіргі уақытта OpenCV, CxImage және т.б.

Алдын ала өңдеу – бинаризация

Қазіргі уақытта сандық камералармен түсірілген суреттердің көпшілігі түрлі-түсті кескіндер болып табылады, олар ақпараттың үлкен көлемін қамтиды және OCR технологиясына сәйкес келмейді.

Суреттің мазмұны үшін оны жай ғана алдыңғы және фонға бөлуге болады.Компьютерді жылдамырақ және OCR байланысты есептеулерді жақсырақ орындау үшін, суретте тек алдыңғы ақпарат пен фондық ақпарат қалуы үшін алдымен түсті кескінді өңдеуіміз керек.Бинаризацияны «ақ-қара» деп те түсінуге болады.

кескін шуды азайту
Әртүрлі кескіндер үшін шудың анықтамасы әртүрлі болуы мүмкін, ал шудың сипаттамаларына сәйкес деноизизация процесі шуды азайту деп аталады.

көлбеу түзету
Өйткені қарапайым қолданушылар құжаттарды суретке түсіру кезінде көлденең және тік туралаумен толықтай түсіру қиынға соғады, сондықтан түсірілген суреттер сөзсіз қиғаш болады, бұл түзету үшін кескінді өңдеу бағдарламалық құралын қажет етеді.

Орта мерзімді өңдеу – макет талдауы
Құжат суреттерін абзацтар мен тармақтарға бөлу процесі макеттік талдау деп аталады.Нақты құжаттардың әртүрлілігі мен күрделілігіне байланысты бұл қадамды әлі де оңтайландыру қажет.

кейіпкерлерді кесу
Суретке түсіру және жазу жағдайларының шектеулеріне байланысты кейіпкерлер жиі кептеліп, қаламдар сынған.Мұндай кескіндерді OCR талдауы үшін тікелей пайдалану OCR өнімділігін айтарлықтай шектейді.Сондықтан таңбаларды сегменттеу қажет, яғни әртүрлі таңбаларды ажырату.

Кейіпкерді тану
Бастапқы кезеңде негізінен шаблонды сәйкестендіру қолданылды, ал кейінгі кезеңде негізінен мүмкіндікті алу қолданылды.Мәтіннің орын ауыстыруы, штрих қалыңдығы, сынған қалам, адгезия, айналу және т.б. сияқты факторлардың әсерінен ерекшеліктерді шығару қиындығы қатты әсер етеді.

Орналасуды қалпына келтіру
Адамдар танылған мәтін бұрынғыдай құжаттың түпнұсқа суреті сияқты реттеліп, абзацтар, орындар және тәртіп Word құжаттарына, PDF құжаттарына және т.б. шығарылады деп үміттенеді және бұл процесс орналасуды қалпына келтіру деп аталады.

кейінгі өңдеу
Нақты тілдік контексттің қатынасына сәйкес тану нәтижесі түзетіледі.

шығару
Белгілі бір пішімдегі мәтін ретінде танылған таңбаларды шығарыңыз.

OCR технологиясына негізделген қол терминалдары қандай қолданбалы?

OCR таңбаларды тану бағдарламалық құралы жүктелген портативті PDA терминалы арқылы көптеген көрініс қолданбаларын жүзеге асыруға болады, мысалы: көлік нөмірін тану, контейнер нөмірін тану, импортталған сиыр және қой етінің салмағын тану, паспорт машинасы оқитын аумақты тану, электр есептегішінің оқуын тану , болат катушкалар Шашыратылған таңбаларды тану.


Жіберу уақыты: 16 қараша 2022 ж
WhatsApp онлайн чаты!