You are using an outdated browser. For a faster, safer browsing experience, upgrade for free today.



  • نویسه‌خوان نوری Optical character recognition

    نویسه‌خوانی نوری که با سرواژه‌ی OCR  شناخته می‌شود، عبارت است از بازشناسی خودکار متون موجود در تصاویر اسناد و تبدیل آنها به متون قابل جستجو و ویرایش توسط رایانه. تصویر سند غالبا توسط پویشگر یا دوربین دیجیتال تولید می‌شود و شامل تعدادی پیکسل با رنگ­های مختلف و سطوح روشنایی گوناگون است (1)

    از دید انسان، یک سند ممکن است ارزش اطلاعاتی زیادی داشته باشد، لیکن از دید رایانه تصویر یک سند با تصویر یک منظره تفاوتی ندارد؛ چرا که هر دوی آنها مجموعه‌ای از پیکسل‌ها هستند. در فناوری اطلاعات و ارتباطات برای اینکه بتوان از اطلاعات نوشتاری تصویر سند استفاده کرد، ابتدا باید به نحوی نوشته‌های موجود در سند را بازشناسی کرد. برای انجام چنین کاری،تشخیص و بازیابی الفبا و نوشته های دست نویس یا تایپ شده طراحی شده از نرم افزار متن خوانی استفاده می­شود که در فرهنک فناوری ارتباطات  با عنوان نویسه‌خوان نوری نامیده می­شود.

    Optical character recognition با علامت اختصاری (OCR) که در فرهنگ فارسی به نویسه خوان نوری ترجمه شده، نوعی فناوری پردازش اطلاعات است که داده­های خواندنی توسط انسان را به رسانه دیگری برای ورود به رایانه تبدیل می کند (2).در واقع نویسه‌خوان نوری فرآیندی است که در آن یک دستگاه الکترونیکی کاراکترهای چاپی روی کاغذ را بررسی می­ کند و با تشخیص الگوهای سیاه و روشن، شکل کاراکترها را تعیین می ­کند و هنگامی که روبشگر شکل کاراکترها را تعیین کرد، روش های شناسایی کاراکتر و الگوی تطبیق به همراه مجموعۀ کاراکترهای ذخیره شده برای تبدیل اشکال به متن کاراکتری مورد استفاده قرار می­گیرد (3).

    نویسه خوان نوری نرم افزاری است که می­توان با آن متن­های دست نویس یا متونی را که قبلا با ماشین تحریر تایپ شده یا نوشته های چاپ شده را به صورت خودکار به متن­های رایانه ای تبدیل نموده و در سامانه­های رایانه­ ای ذخیره کرد. یعنی تبدیل تصاویر کلمات به کدهای کلمات (باقابلیت ذخیره در سامانه­ رایانه) و انجام هرگونه پردازش برروی هر متنی که در رایانه ذخیره شده است. مثلاً آن را می­توان ویرایش کرد یا آن را می­ توان  به حروف و نوشته ­های خطی، یا به خط بریل (مخصوص نابینایان)  تبدیل نمود.بدین ترتیب همۀ نوشته های بشر توسط نابینایان قابل خوانده شدن است.

    واژۀ OCR ابتدا تنها در مورد بازشناسی ارقام و حروف چاپی به کار گرفته می‌شد. پسوند نوری در این عبارت در مقابل عبارت مرکب مغناطیسی قرار داده شد تا این روش را از روش قدیمی‌تر بازشناسی نویسه‌ها با مرکب مغناطیسی ،MICR، متمایز کند. با گذشت زمان و پیشرفت قابل توجه در این زمینه، روش‌های بازشناسی دست نوشته و متون چاپی مطرح شدند که دامنۀ کار را به کلمات و عبارات رساندند. با وجود عدم تطبیق دقیق OCR با این موارد، این نام برای این روش‌ها و تا حدی برای بازشناسی دست‌نوشته‌های برخط هم استفاده شد و رواج پیدا کرد. هم‌اکنون OCR را بیشتر برای بازشناسی مستندات چاپی مثل صفحات کتاب‌ها، مجله‌ها و نامه‌های چاپی به کار می‌برند (4).

    سامانۀ¬ نویسه‌خوان مثل یک نفر ماشین‌نویس، متن سند را می‌خواند و آن را به قالب مناسب برای ذخیره در رایانه تبدیل می‌کند. معمولاً یک پویشگر، تصویر سند را برای OCR فراهم می‌کند. سامانۀ نویسه‌خوان، اشیای موجود در تصویر سند را که ارقام، حروف، علائم و کلمات هستند، بازشناسی کرده و رشتۀ متناظر با آن‌ها را در قالب مناسب ذخیره می‌کند. یک فایل تصویری، حجم زیادی دارد و جستجوی متنی در آن ممکن نیست. این در حالی است که فایل خروجی سامانۀ­ نویسه‌خوان بسیار کم حجم و قابل جستجوست. 

    سامانه‌های نویسه‌خوان مثل بسیاری از سامانه‌های هوشمند دیگر، پیچیدگی زیادی دارند. پردازش تصویر و بازشناسی الگو دو پایۀ اصلی این سامانه‌ها هستند. پیچیدگی این سامانه‌ها برای زبان­های گوناگون، متفاوت است. به عنوان مثال نوشتن OCR برای زبان­های لاتین به دلیل اینکه حروف آنها به طور مجزا نوشته می‌شود. از زبان­هایی مثل فارسی و عربی که حروف یک کلمه به یکدیگر می‌چسبند- آسان­تر است. این موضوع به علاوۀ جمعیت کم کاربران زبان فارسی، سبب شده سامانه‌های نویسه‌خوان قدرتمندی برای زبان فارسی نداشته باشیم. البته در سال¬های اخیر تلاش های قابل تقدیری از سوی برخی شرکت های فعال در زمینۀ پردازش تصویر انجام شده که برخی از آنها منجر به محصولات قابل قبولی شده است (5.

    انواع نویسه خوان نوری:

    1-     نویسه خوان نوری برای متون تایپی «نوعی که یک متن قبلا تایپ شده (مثل کتاب یا روزنامه) را می-توان وارد  رایانه کرد» ،

    2-     نویسه خوان نوری برای متون دست نویس. «نوعی که متن دست نویس را می-تواند بخواند.» متن­های دست نویس به دو صورت گسسته و پیوسته وجود دارند: متن دست نویس پیوسته مانند همان چیزهایی است که هرچندگاهی که روی کاغذ می­نویسیم، مانند یک نامه، یا یک شعر و غیره. اما متن دست نویس گسسته همان نوشته­هایی است که حروف آن جدا از هم و به صورت گسسته نوشته شده­اند مثل نام و نام خانوادگی که در فرم­های آزمون ثبت نام،‌ به صورت هر حرف داخل یک کادر نوشته می شوند یا مثل اعداد.(6)

    کاربرد نویسه خوان در مأموریت های پلیس

    البته استفاده از OCR تنها برای تبدیل تصویر متون تایپ شده به متن تایپی نیست. بلکه هر جا عکسی باشد ودر قسمتی از آن حرف یا شماره ای وجود داشته باشد، نرم افزار OCR آن را تشخیص می­دهد. بعد از آنکه تصویر حاوی متن اسکن گردید و رایانه پردازشی را بر روی تصویر انجام داد. ابتدا تصویر را به قسمت­های مجزا تقسیم می­کند. بعد با استفاده از الگوریتم­های پردازش تصویر و هوش مصنوعی، حروف کاراکترهایی را از درون متن استخراج می­کند. اما ممکن است متن مورد نظرهنگام عکس­برداری چرخیده باشد. در نتیجه رایانه عکس را چند درجه می­چرخاند و باز عمل قبل را بر روی آن انجام می-دهد و نتیجه را به دست می­آورد. البته در اکثر موارد کار به همین راحتی که گفته می¬شود نیست و فرآیند عملیات پیچیده دیگری باید روی تصویر انجام گیرد.

    از کاربردهای نویسه خوان نوری در ناجا می­توان به استفاده از آن در دوربین­های هوشمند سرعت سنج جاده¬ها در حوزۀ ماموریت راهور اشاره داشت. شماره پلاک خودرو یکی از مناسب‌ترین اقلام اطلاعاتی برای احراز هویت خودروهاست. تشخیص خودکار شماره پلاک خودرو، سامانه‌ای برای خواندن پلاک وسیله نقلیه با استفاده از نویسه‌خوان نوری است.

    تشخیص خودکار شماره پلاک خودرو سامانه‌ای کاملاً مکانیزه­است که با استفاده از پردازش تصویر خودروهای عبوری از یک مکان، شماره پلاک آنها را استخراج می‌کند. برای استفاده از این سامانه، نیازی به نصب و تجهیز خودروها به وسیله­ی دیگری (مانند GPS یا برچسب‌های رادیوی RFID Tag) وجود ندارد. این سامانه با استفاده از دوربین‌های مخصوص، تصویری از خودرو در حال عبور اخذ می‌کند و آن تصویر را برای پردازش توسط نرم‌افزار تشخیص پلاک خودرو به رایانه ارسال می‌کند.نرم افزار نویسه خوان در دوربین سرعت سنج؛ به صورت مستمر؛ سرعت خودرو ها را اندازه گیری می­کند و بعد از شناسایی خودروی متخلف، از پلاک خودرو عکس می­گیرد و پس از پردازش،  شماره پلاک ماشین را شناسایی کرده و در سامانه ذخیره می­نماید. نویسه خوان نوری در زمینه‌های امنیتی و ترافیکی بسیار کاربرد دارد.

    کلید واژه­ها

    نویسه خوان نوری، پردازش تصویر،  دوربین سرعت سنج،

    ارجاعات

    1-     نویسه‌خوانی نوری از واژه‌های مصوب فرهنگستان زبان و ادب فارسی به جای optical character recognition یا OCR  در انگلیسی و در حوزۀ رایانه است.  فرهنگ واژه‌های مصوّب فرهنگستان: ۱۳۷۶ تا ۱۳۸۵، بخش لاتین«. فرهنگستان زبان و ادب فارسی. ۱۴۴. بازبینی‌شده در ۷ فروردین ۱۳۹۱»

    2-     حسنوی، رضا. فرهنگ اصطلاحات کامپیوتر. ویرایش ششم، انتشارات رایزن، 1379،ص504.

    3-  ابراهیم زاده قلزم، حسین؛ رضا حسنوی و داریوش فرسائی. فرهنگ تشریحی کامپیوتر ماکروسافت.انتشارات دانشیار، 1378، ص420.

    4-   John Resig (2009-01-23). "John Resig– OCR and Neural Nets in JavaScript".

    5-   Schantz, Herbert F. (1982). The historyofOCR, optical character recognition.

    6-      www.microrayaneh.com

     

     

     

نظر شما