PDA

View Full Version : ขอคำแนะนำ...เรื่องOCR



yanjai26
08-05-2003, 04:10 AM
ในตอนนี้กำลังทำโปรเจคเกี่ยวกับเรื่องการรู้จำตัวอักษร(OCR) ซึ่งเป็นโปรเจคกลุ่ม ซึ่งแต่ละคนจะได้ขั้นตอนในแต่ละส่วนของกระบวนการนี้ไปทำ เช่น 1.แยกรูปภาพออกจากหน้ากระดาษ
2. แยกสมการคณิตศาสตร์ออกจากหน้าเอกสาร
3. กำจัด noise เป็นต้น
ซึ่งกระผมเองได้ในส่วนของการรู้จำตัวอักษรภาษาอังกฤษ(แบบตัวพิมพ์) ซึ่งอยากจะขอคำแนะนำจากท่านทั้งหลายว่าจะสามารถหาข้อมูลในการทำงานในขั้นตอนนี้ได้อย่างไร หรือว่าท่านใดสามารถอธิบายขั้นตอนในการทำงานของกระบวนการนี้ได้บ้าง กรุณาช่วยหน่อยนะครับ หวังว่าคงจะได้รับความกรุณาจากทุก ๆ ท่าน
(yut.406@thaimail.com)

RedAnalyzer
09-05-2003, 03:00 AM
ผมก็เป็นนักศึกษา cs คนนึงที่เคยเป็นผู้ช่วยอาจารย์ที่ภาคทำงานเกี่ยวกับ speech recognition ที่จริงผมก็ไม่ได้สันทัดเรื่อง OCR หรอกครับ แต่เคยสงสัยและถามอาจารย์ ท่านก็อธิบายขั้นตอนคร่าวๆให้ฟังว่า

มันเป็นกระบวนการ image processing แบบหนึ่ง การที่จะทำให้เกิดการจดจำ (regcognition) ภาพได้นั้นประการแรกเลยจะต้องแยกส่วนที่เป็นรูปภาพออกจากพื้นหลังให้ได้ก่อน ส่วนวิธีการนั้น รุ่นพี่ของผมที่ทำงานชิ้นนี้กับอาจารย์เค้าใช้โปรแกรม matlab เป็นตัวช่วย โดยใช้หลักหา pattern ของตัวอักษรด้วยการตัดภาพ ต้องขอโทษด้วยที่จำรายละเอียดไม่ได้นะครับ
หลังจากนั้นก็เอาส่วนที่เป็นตัวอักษรมา train ให้กับ model (HK model) เป็นการสร้าง AI เพื่อให้จดจำรูปแบบของการ input เข้าไปได้

ลองเข้าไปที่เว็บนี้ดูนะครับเผื่อจะช่วยอะไรได้บ้าง

http://www.imageprocessingtools.com
ตัวผมเองก็รู้แค่เพียงรูปแบบกว้างๆเท่านั้นแหละครับ หวังว่าคงช่วยอะไรบ้างนะครับ

yanjai26
11-05-2003, 12:42 AM
ขอบคุณมากครับ