+86-755-29031883

การใช้งานฟังก์ชัน PDA ของเทอร์มินัลพกพา OCR คืออะไร

เทคโนโลยี OCR คืออะไร?

การรู้จำอักขระด้วยแสง (อังกฤษ: Optical Character Recognition, OCR) หมายถึงกระบวนการวิเคราะห์และจำแนกไฟล์รูปภาพของวัสดุข้อความเพื่อให้ได้ข้อความและข้อมูลเค้าโครง

เช่นเดียวกับการจดจำภาพและเทคโนโลยีวิชันซิสเต็ม กระบวนการประมวลผลของเทคโนโลยี OCR ยังแบ่งออกเป็นกระบวนการอินพุต การประมวลผลล่วงหน้า การประมวลผลระยะกลาง การประมวลผลภายหลัง และการประมวลผลเอาต์พุต

เข้า
สำหรับรูปแบบภาพที่แตกต่างกัน มีรูปแบบการจัดเก็บและวิธีการบีบอัดที่แตกต่างกันปัจจุบันมี OpenCV, CxImage เป็นต้น

การประมวลผลล่วงหน้า – ไบนาไรเซชัน

รูปภาพส่วนใหญ่ที่ถ่ายด้วยกล้องดิจิทัลในปัจจุบันเป็นภาพสีซึ่งมีข้อมูลจำนวนมากและไม่เหมาะกับเทคโนโลยี OCR

สำหรับเนื้อหาของรูปภาพ เราแบ่งง่ายๆ ออกเป็นพื้นหน้าและพื้นหลังในการทำให้คอมพิวเตอร์เร็วขึ้นและทำการคำนวณที่เกี่ยวข้องกับ OCR ได้ดีขึ้น เราจำเป็นต้องประมวลผลภาพสีก่อน เพื่อให้ข้อมูลพื้นหน้าและข้อมูลพื้นหลังเท่านั้นที่ยังคงอยู่ในรูปภาพไบนาไรเซชันสามารถเข้าใจได้ง่ายๆ ว่า "ขาวดำ"

การลดสัญญาณรบกวนของภาพ
สำหรับภาพที่แตกต่างกัน คำจำกัดความของสัญญาณรบกวนอาจแตกต่างกัน และกระบวนการลดสัญญาณรบกวนตามลักษณะของสัญญาณรบกวนเรียกว่า การลดสัญญาณรบกวน

การแก้ไขความเอียง
เนื่องจากผู้ใช้ทั่วไปเมื่อถ่ายภาพเอกสาร จึงเป็นเรื่องยากที่จะถ่ายภาพให้ตรงแนวแนวนอนและแนวตั้งได้อย่างสมบูรณ์ ดังนั้นภาพที่ถ่ายออกมาจะบิดเบี้ยวอย่างหลีกเลี่ยงไม่ได้ ซึ่งต้องใช้ซอฟต์แวร์ประมวลผลภาพในการแก้ไข

การประมวลผลระยะกลาง – การวิเคราะห์เค้าโครง
กระบวนการแบ่งรูปภาพเอกสารออกเป็นย่อหน้าและสาขาเรียกว่าการวิเคราะห์เค้าโครงเนื่องจากเอกสารจริงมีความหลากหลายและซับซ้อน ขั้นตอนนี้ยังคงต้องได้รับการปรับปรุงให้เหมาะสม

การตัดตัวละคร
เนื่องจากข้อจำกัดของสภาพการถ่ายภาพและการเขียน อักขระมักจะติดและปากกาหักการใช้ภาพดังกล่าวโดยตรงสำหรับการวิเคราะห์ OCR จะจำกัดประสิทธิภาพ OCR อย่างมากดังนั้นจึงจำเป็นต้องมีการแบ่งส่วนอักขระ กล่าวคือ แยกอักขระต่างๆ

การจดจำตัวละคร
ในระยะแรก การจับคู่เทมเพลตจะใช้เป็นหลัก และในระยะต่อมา จะใช้การแยกคุณลักษณะเป็นหลักเนื่องจากอิทธิพลของปัจจัยต่างๆ เช่น การเคลื่อนตัวของข้อความ ความหนาของเส้นขีด ปากกาหัก การยึดเกาะ การหมุน ฯลฯ ความยากในการแยกคุณลักษณะจึงได้รับผลกระทบอย่างมาก

การคืนค่าเค้าโครง
ผู้คนต่างหวังว่าข้อความที่รู้จักจะยังคงจัดเรียงเหมือนรูปภาพเอกสารต้นฉบับ และย่อหน้า ตำแหน่ง และลำดับจะถูกส่งออกไปยังเอกสาร Word เอกสาร PDF เป็นต้น และกระบวนการนี้เรียกว่าการคืนค่าเค้าโครง

หลังการประมวลผล
ตามความสัมพันธ์ของบริบทภาษาเฉพาะ ผลการจดจำจะได้รับการแก้ไข

เอาต์พุต
ส่งออกอักขระที่รู้จักเป็นข้อความในรูปแบบที่กำหนด

การใช้งานเทอร์มินัลแบบพกพาที่ใช้เทคโนโลยี OCR คืออะไร

ผ่านเทอร์มินัลพกพา PDA ที่โหลดด้วยซอฟต์แวร์การจดจำอักขระ OCR ทำให้สามารถรับรู้การใช้งานฉากต่างๆ มากมาย เช่น: การจดจำป้ายทะเบียนรถยนต์ การจดจำหมายเลขตู้คอนเทนเนอร์ การจดจำฉลากน้ำหนักเนื้อวัวและเนื้อแกะนำเข้า การจดจำพื้นที่ที่เครื่องอ่านหนังสือเดินทาง ,เหล็กม้วนตัวรับพ่นตัวอักษร


เวลาโพสต์: 16 พ.ย.-2565
WhatsApp แชทออนไลน์ !