+ 86-755-29031883

מהם היישומים של פונקציית PDA מסוף כף יד OCR?

מהי טכנולוגיית OCR?

זיהוי תווים אופטי (באנגלית: Optical Character Recognition, OCR) מתייחס לתהליך של ניתוח וזיהוי קובצי תמונה של חומרי טקסט כדי לקבל מידע על טקסט ופריסה.

בדומה לטכנולוגיית זיהוי תמונה וראיית מכונה, גם תהליך העיבוד של טכנולוגיית OCR מחולק לקלט, עיבוד מקדים, עיבוד אמצע מועד, עיבוד שלאחר ותהליך פלט.

להיכנס
עבור פורמטים שונים של תמונה, ישנם פורמטי אחסון שונים ושיטות דחיסה שונות.נכון לעכשיו, יש OpenCV, CxImage וכו'.

עיבוד מקדים - בינאריזציה

רוב התמונות המצולמות היום במצלמות דיגיטליות הן תמונות צבעוניות, המכילות כמות עצומה של מידע ואינן מתאימות לטכנולוגיית OCR.

עבור תוכן התמונה, אנחנו יכולים פשוט לחלק אותה לקדמה ולרקע.על מנת להפוך את המחשב למהיר יותר ולבצע טוב יותר חישובים הקשורים ל-OCR, עלינו לעבד תחילה את התמונה הצבעונית, כך שרק מידע החזית ומידע הרקע יישארו בתמונה.ניתן להבין בינאריזציה בפשטות כ"שחור ולבן".

הפחתת רעשי תמונה
עבור תמונות שונות, ההגדרה של רעש עשויה להיות שונה, ותהליך הפחתת הרעש על פי מאפייני הרעש נקרא הפחתת רעש.

תיקון הטיה
מכיוון שמשתמשים רגילים, כאשר מצלמים מסמכים, קשה לצלם לחלוטין בקנה אחד עם יישור אופקי ואנכי, כך שהתמונות שצולמו בהכרח יהיו מוטות, מה שדורש תוכנת עיבוד תמונה כדי לתקן.

עיבוד ביניים - ניתוח פריסה
תהליך חלוקת תמונות המסמכים לפסקאות ולענפים נקרא ניתוח פריסה.בשל הגיוון והמורכבות של מסמכים בפועל, שלב זה עדיין צריך לעבור אופטימיזציה.

חיתוך תווים
בשל המגבלות של תנאי הצילום והכתיבה, תווים לרוב נתקעים ועטים שבורים.שימוש ישיר בתמונות כאלה לניתוח OCR יגביל מאוד את ביצועי OCR.לכן נדרש פילוח תווים, כלומר להפריד בין תווים שונים.

זיהוי תווים
בשלב המוקדם נעשה שימוש בעיקר בהתאמת תבניות, ובשלב המאוחר יותר נעשה שימוש בעיקר בחילוץ תכונות.בשל השפעתם של גורמים כגון תזוזת טקסט, עובי שבץ, עט שבור, הידבקות, סיבוב וכו', הקושי בחילוץ התכונות מושפע מאוד.

שחזור פריסה
אנשים מקווים שהטקסט המוכר עדיין מסודר כמו תמונת המסמך המקורית, והפסקאות, המיקומים והסדר מופקים למסמכי Word, מסמכי PDF וכו', ותהליך זה נקרא שחזור פריסה.

לאחר עיבוד
בהתאם ליחס של הקשר שפה ספציפי, תוצאת הזיהוי מתוקנת.

תְפוּקָה
פלט את התווים המוכרים כטקסט בפורמט מסוים.

מהם היישומים של מסופים כף יד המבוססים על טכנולוגיית OCR?

באמצעות מחשב כף יד מסוף כף היד הטעון בתוכנת זיהוי תווים OCR, ניתן לממש יישומי סצנה רבים, כגון: זיהוי לוחית רישוי לרכב, זיהוי מספרי מכולה, זיהוי תווית משקל בקר וכבש מיובא, זיהוי אזור קריא במכונה בדרכון, זיהוי קריאת מונה חשמלי , סליל פלדה זיהוי של תווים מרוססים.


זמן פרסום: 16 בנובמבר 2022
WhatsApp צ'אט מקוון!