+ 86-755-29031883

کاربردهای عملکرد PDA ترمینال دستی OCR چیست؟

فناوری OCR چیست؟

تشخیص کاراکتر نوری (به انگلیسی: Optical Character Recognition, OCR) به فرآیند تجزیه و تحلیل و تشخیص فایل‌های تصویری مواد متنی برای به دست آوردن اطلاعات متن و طرح‌بندی اشاره دارد.

مشابه با فناوری تشخیص تصویر و بینایی ماشین، فرآیند پردازش فناوری OCR نیز به ورودی، پیش پردازش، پردازش میان‌مدت، پس پردازش و فرآیند خروجی تقسیم می‌شود.

وارد
برای فرمت های مختلف تصویر، فرمت های ذخیره سازی متفاوت و روش های فشرده سازی متفاوتی وجود دارد.در حال حاضر OpenCV، CxImage و غیره وجود دارد.

پیش پردازش - باینریزه کردن

امروزه بیشتر تصاویری که توسط دوربین های دیجیتال گرفته می شود تصاویر رنگی هستند که حاوی حجم عظیمی از اطلاعات هستند و برای فناوری OCR مناسب نیستند.

برای محتوای تصویر، به سادگی می توانیم آن را به پیش زمینه و پس زمینه تقسیم کنیم.برای اینکه رایانه سریع‌تر و بهتر محاسبات مربوط به OCR را انجام دهد، ابتدا باید تصویر رنگی را پردازش کنیم تا فقط اطلاعات پیش‌زمینه و اطلاعات پس‌زمینه در تصویر باقی بماند.Binarization را می توان به سادگی به عنوان "سیاه و سفید" نیز درک کرد.

کاهش نویز تصویر
برای تصاویر مختلف، تعریف نویز ممکن است متفاوت باشد و فرآیند حذف نویز با توجه به ویژگی های نویز را کاهش نویز می گویند.

اصلاح شیب
از آنجایی که کاربران معمولی هنگام عکسبرداری از اسناد، عکاسی کاملاً در راستای تراز افقی و عمودی دشوار است، بنابراین تصاویر گرفته شده به ناچار کج می شوند که اصلاح آن نیازمند نرم افزارهای پردازش تصویر است.

پردازش میان مدت - تجزیه و تحلیل طرح
فرآیند تقسیم تصاویر اسناد به پاراگراف ها و شاخه ها را تجزیه و تحلیل layout می نامند.با توجه به تنوع و پیچیدگی اسناد واقعی، این مرحله همچنان نیاز به بهینه سازی دارد.

برش شخصیت
به دلیل محدودیت های شرایط عکاسی و نوشتن، شخصیت ها اغلب گیر می کنند و قلم ها شکسته می شوند.استفاده مستقیم از چنین تصاویری برای آنالیز OCR عملکرد OCR را تا حد زیادی محدود می کند.بنابراین، تقسیم کاراکترها، یعنی جداسازی کاراکترهای مختلف مورد نیاز است.

شخصیت شناسی
در مرحله اولیه عمدتاً از تطبیق الگو استفاده می شد و در مرحله بعدی عمدتاً از استخراج ویژگی استفاده می شد.به دلیل تأثیر عواملی مانند جابجایی متن، ضخامت ضربه، قلم شکسته، چسبندگی، چرخش و غیره، دشواری استخراج ویژگی به شدت تحت تأثیر قرار می گیرد.

ترمیم چیدمان
مردم امیدوارند که متن شناسایی شده همچنان مانند تصویر سند اصلی مرتب شده باشد و پاراگراف ها، موقعیت ها و ترتیب به اسناد Word، اسناد PDF و غیره خروجی داده شود و به این فرآیند بازیابی layout گفته می شود.

پس پردازش
با توجه به رابطه بافت زبان خاص، نتیجه تشخیص تصحیح می شود.

خروجی
خروجی کاراکترهای شناسایی شده به عنوان متن در یک فرمت خاص.

کاربرد پایانه های دستی مبتنی بر فناوری OCR چیست؟

از طریق PDA ترمینال دستی که با نرم‌افزار تشخیص کاراکتر OCR بارگذاری شده است، می‌توان به کاربردهای صحنه‌های بسیاری مانند: تشخیص پلاک خودرو، تشخیص شماره ظرف، تشخیص برچسب وزن گوشت گاو و گوسفند وارداتی، تشخیص ناحیه قابل خواندن توسط ماشین گذرنامه، تشخیص قرائت کنتور الکتریکی اشاره کرد. ، سیم پیچ فولادی تشخیص کاراکترهای اسپری شده.


زمان ارسال: نوامبر-16-2022
چت آنلاین واتس اپ!