آزمایش تصویر اسکن شدهشکل
زیر قبل و بعد از عملیات بهبود تصویر را نشان می دهد .
بعد
از به اتمام رسیدن کار ، متن نهایی در جعبه متن های سمت راست پنجره برای
هر کدام از شبکه های LVQ نمایش داده می شود . همچنین نحوه قطعه بندی کردن
تصویر نیز در سمت چپ مشخص می شود .
شکل
های زیر همان متن اسکن شده است ولی از برگه چاپ شده آن بوسیله دوربین
دیجیتال عکس گرفته شده . همان طور که مشاهده می شود انحنایی که دوربین در
تصویر ایجاد می کند میزان قطعه بندی با استفاده از projection را به شدت با
خطا روبرو می کند . در تابع OCR ، فرض بر این است که قطعه بندی به شکلی
باشد که یک حرف تمام یک قطعه را بگیرد . اما در سطرهای پایین به علت زاویه
دار بودن سطر ، کاراکتر بالا یا پایین قطعه قرار گرفته و باعث شده است که
OCR تفسیر اشتباهی از تصویر قطعه قطعه شده داشته باشد .
شکل
زیر screen shot از پنجره Word است که تمامی حروف الفبای بزرگ انگلیسی در
آن با فونت Arial و Calibri نوشته شده است . برای حذف نویز (screen shot
نویز ندارد !) از smoothing معمولی استفاده شده است . همانطور که قابل
مشاهده است قطعه بندی به شکل صحیحی صورت گرفته و حروف به درستی تشخیص داده
شده اند . تصاویر به فرمت png هستند .
تصویر
زیر عکسی است که با دوربین تلفن همراه از یک برگ کاغذ که با خودکار مشکی
روی آن نوشته شده است تهیه شده . قطعه بندی و تشخیص دست خط پیچیده تر از
روش پیاده سازی شده در این پروژه است . تعداد بسیار کمی از حروف در این شکل
تشخیص داده شده اند .
منابع Fundamentals of
neural networks , Laurence Fausett
Digital Image Processing ,
Gonzalez
An Overview Of Character Recognition Focused On Off-line
Handwriting Nafiz Arica, Student Member, IEEE and Fatos T.
Yarman-Vural, Senior Member, IEEE
Wikipedia
Retrieval of
Machine-printed Latin Documents through Word Shape Coding Shijian Lu,
Chew Lim Tan