چکیده
شبیه سازی ماشین خواندن انسان، برای تقریبا سه دهه موضوع تحقیقات فشرده ای بوده است. تعداد زیادی از مقالات و گزارشات پژوهشی در مورد کاراکترهای لاتین، چینی و ژاپنی منتشر شده است. با این حال، کار کمی در مورد تشخیص خودکار کاراکترهای عربی به دلیل پیچیدگی متن چاپ شده و دست نوشته انجام شده است و این مشکل هنوز هم یک میدان تحقیقاتی باز است. هدف اصلی این مقاله، ارائه حالت عربی پژوهش تشخیص کاراکتر در سراسر دو دهه گذشته است.
1. مقدمه
سیستم های تشخیص کاراکتر می توانند به طور فوق العاده به پیشرفت فرآیند اتوماسیون کمک نمایند و می توانند تعامل بین انسان و ماشین را در بسیاری از کاربردها، از جمله اتوماسیون اداری، تأیید بررسی و انواع زیادی از بانکداری، کاربردهای کسب و کار و ورود اطلاعات بهبود ببخشند.
روش های مختلف پوشش داده شده تحت اصطلاح کلی تشخیص کاراکتر در دو دسته آنلاین یا آفلاین قرار می گیرند که هر یک دارای الگوریتم های تشخیص و سخت افزار خاص خود هستند.
در سیستم های تشخیص کاراکتر آنلاین، کامپیوتر، نمادها را زمانی که ترسیم می شوند، تشخیص می دهد. (1-4) رایج ترین سطح نوشتن، تبلت دیجیتالی است که از طریق یک قلم خاص در تماس با سطح تبلت عمل می کند و مختصات نقاط ترسیم شده را در یک فرکانس ثابت ساطع می کند. قطع تماس، انتقال یک کاراکتر خاص را بی درنگ برانگیخته می کند. بنابراین، ثبت بر روی تبلت، موجب تولید رشته های مختصات از هم جدا شده توسط علائم می شود، زمانی که قلم دیگر سطح تبلت را لمس نمی کند.
تشخیص آنلاین دارای چند ویژگی جالب است. اول، تشخیص به جای تصاویر دو بعدی، همانند مورد تشخیص آفلاین، بر روی داده های یک بعدی انجام می شود. خط نوشتن با دنباله ای از نقاط نمایش داده می شود که محل آن، یک تابع از زمان است. این کار دارای نتایج متعدد مهمی است:
● نظم نوشتن در دسترس است و می توان آن را توسط فرایند شناسایی استفاده نمود.
● خط نوشتن، هیچ عرضی ندارد.
● اطلاعات زمانی، مانند سرعت نیز می تواند در نظر گرفته شود.
● علاوه بر این، بلند کردن های قلم می تواند در فرآیند تشخیص مفید باشد.
در میان سیستم های آنلاین که کاراکترهای جدا شده عربی را تشخیص می دهد، چندین روش را می توان در مراجع یافت (5) - (11). (Amin) (12) سه روش را برای تشخیص آنلاین کلمات خط شکسته عربی دست نوشته معرفی نموده است. اولی یک روش ساختاری (13) بر اساس بخش بندی کلمه به کاراکترها است. سپس کاراکترها با استفاده از روش شبیه به روش کاراکترهای جدا شده تشخیص داده می شوند. (15) تشخیص کلمه با ساخت همه کلمات ممکن، با دنبال نمودن هر مسیر در گراف هم ارزی شبکه کار می کند. نمودارهای دودویی (14) نیز برای کنار گذاشتن ترکیب فاقد شرایط لازم از حروف استفاده می شوند. روش دوم، روشی نحوی (15) بر اساس تقسیم بندی کلمات به شکل های هندسی اولیه مانند منحنی ها و تکان ها است. یک اتوماسیون، شکلهای هندسی اولیه را به یک لیست از کاراکترهای تشکیل دهنده کلمه تبدیل می نماید: (16، 17) هر کلمه با توجه به بردار از برخی از پارامترهای از پیش تعیین شده مشخص می شود: در نهایت، روش سوم از یک رویکرد کلی استفاده می کند. علاوه بر این، به منظور ارتقای نرخ تشخیص، یک تحلیلگر نحوی و معنایی که ساختار گرامری و معنای جمله عربی را تایید می نماید، است استفاده می شود. (18)
Al-Emmami و Usher (19)، یک سیستم را برای تشخیص آنلاین کلمات دست نویس عربی ارائه نمودند. کلمات به تکان هایی مبتنی بر روش پیشنهادی توسط Belaid تقسیم می شوند. (20) در فرایند یادگیری اولیه، مشخصات تکان ها از هر کاراکتر به سیستم تغذیه می شود، در حالی که در فرایند شناسایی، پارامترهای هر تکان یافت می شوند و قوانین خاص برای انتخاب مجموعه ای از تکان ها به کار برده می شوند که به بهترین شکل با ویژگی های یکی از کاراکترهای ذخیره شده مطابقت می یابند. با این حال، چند کلمه در فرآیند یادگیری و آزمایش مورد استفاده قرار می گیرند که عملکرد سیستم را سوال برانگیز می سازد.
تشخیص آفلاین، پس از اینکه نوشتن یا چاپ کامل می شود، انجام می شود. تشخیص کاراکتر نوری، OCR، (21-29) با تشخیص کاراکترهای نوری پردازش شده به جای تشخیص کاراکترهای مغناطیسی پردازش شده سرو کار دارد. در یک سیستم معمولی OCR، کاراکترختی ورودی خوانده می شوند و توسط یک اسکنر نوری دیجیتالی می شوند. سپس هر کاراکتر موقعیت یابی و بخش بندی می شود ماتریس حاصل به یک پیش پردازنده برای صاف کردن، کاهش نویز، و نرمالسازی اندازه تغذیه می شود. تشخیص آفلاین را می توان به عنوان کلی ترین مورد در نظر گرفت: هیچ دستگاه خاصی برای نوشتن لازم نیست و تفسیر سیگنال، همانند این مورد در تشخیص انسان، مستقل از تولید سیگنال است.
در طول سه دهه گذشته، بسیاری از روش های مختلف توسط تعداد زیادی از دانشمندان به منظور تشخیص کاراکترها بررسی شده است. انواع روش ها پیشنهاد شده است و توسط محققان در نقاط مختلف جهان آزمایش شده، از جمله روش های آماری، (30-32) روش ساختاری و نحوی، (33-35)، شبکه های عصبی، (36-38) سیستم های خبره (39- 41) و یادگیری ماشین. (42-44)
بسیاری از مقالات با تشخیص کاراکترهای لاتین، چینی و ژاپنی مرتبط هستند. با این حال، اگر چه تقریبا یک سوم از یک میلیارد نفر در سراسر جهان، در چند زبان مختلف، از کاراکترهای عربی برای نوشتن استفاده می نماید، پیشرفت تحقیقاتی کمی، به صورت آنلاین و آفلاین برای تشخیص خودکار کاراکترهای عربی به دست آمده است. این یک نتیجه از عدم حمایت کافی از نظر بودجه، و کاربردهای دیگر مانند پایگاه داده های متن عربی، واژه نامه، و غیره و البته به دلیل ماهیت خط شکسته قوانین نوشتن آن است.
اگر چه نظرسنجی های دیگر با هر دوی کاراکترهای آنلاین و آفلاین عربی بررسی شده اند، (45-47) این مقاله تلاش می کند تا به طور خلاصه همه کارهای انجام شده در دو دهه گذشته را تنها در مورد سیستم های آنلاین در تلاش برای اشاره دقیق به حوزه های دقیق که باید با آنها مقابله شود، خلاصه نماید. ادامه این مقاله به شرح زیر سازماندهی شده است: بخش 2 به بررسی برخی از ویژگی های اساسی نوشتن عربی می پردازد. بخش 3 روش های مختلف برای تقسیم بندی و استخراج ویژگی را پوشش می دهد و روش های مختلف اتخاذ شده برای تشخیص را ارائه می دهد. در نهایت، نتایج در بخش 4 ارائه شده است.
Abstract
Machine simulation of human reading has been the subject of intensive research for almost three decades. A large number of research papers and reports have already been published on Latin, Chinese and Japanese characters. However, little work has been conducted on the automatic recognition of Arabic characters because of the complexity of printed and handwritten text, and this problem is still an open research field. The main objective of this paper is to present the state of Arabic character recognition research throughout the last two decades.
1. INTRODUCTION
Character recognition systems can contribute tremendously to the advancement of the automation process and can improve the interaction between man and machine in many applications, including office automation, check verification and a large variety of banking, business and data entry applications.
The different approaches covered under the general term character recognition fall into either the on-line or off-line category, each having its own hardware and recognition algorithms.
In on-line character recognition systems, the computer recognizes the symbols as they are drawn.(1~4) The most common writing surface is the digitizing tablet, which operates through a special pen in contact with the surface of the tablet and emits the coordinates of the plotted points at a constant frequency. Breaking contact prompts the transmission of a special character. Thus, recording on the tablet produces strings of coordinates separated by signs indicating when the pen has ceased to touch the tablet surface.
On-line recognition has several interesting characteristics. First, recognition is performed on one-dimensional data rather than two-dimensional images as in the case of off-line recognition. The writing line is represented by a sequence of dots whose location is a function of time. This has several important consequences:
● The writing order is available and can be used by the recognition process.
● The writing line has no width.
● Temporal information, like velocity can also be taken into consideration.
● Additionally, penlifts can be useful in the recognition process.
Among the on-line systems that recognize isolated Arabic characters, several methods can be found in references (5)—(11). Amin(12) introduced three methods for recognizing on-line handwritten Arabic cursive words. The first is a structural method(13) based on segmenting the word into characters. Characters are then recognized using a method similar to that for isolated characters.(15) Word recognition works by constructing all possible words by following every path in the equivalence graph of the lattice. Binary diagrams(14) are also used to discard ineligible combination of letters. The second is syntactical method(15) based on segmentation of words into primitives such as curves and strokes. An automaton transforms the primitives into a list of the characters constituting the word. Finally, the third method uses a global approach:(16,17) each word is identified according to a vector of some pre-determined parameters. Furthermore, to enhance the recognition rate a syntactic and semantic analyzer that verifies the grammatical structure and the meaning of Arabic sentence is used.
Al-Emmami and Usher(19) presented a system for on-line recognition of Handwritten Arabic words. Words are segmented into strokes based on the method proposed by Belaid.(20) In the preliminary learning process, specifications of the strokes of each characters are fed to the system, while in the recognition process, the parameters of each stroke are found and special rules are applied to select the collection of strokes that best match the features of one of the stored characters. However, few words were used in the learning and testing process, which make the performance of the system questionable.
Off-line recognition is performed after the writing or printing is completed. Optical Character Recognition, OCR,(21~29) deals with the recognition of optically processed characters rather than magnetically processed ones. In a typical OCR system, input characters are read and digitized by an optical scanner. Each character is then located and segmented and the resulting matrix is fed into a preprocessor for smoothing, noise reduction, and size normalization. Off-line recognition can be considered the most general case: no special device is required for writing and signal interpretation is independent of signal generation, as in human recognition.
Over the past three decades, many different methods have been explored by a large number of scientists to recognize characters. A variety of approaches have been proposed and tested by researchers in different parts of the world, including statistical methods,(30~32) structural and syntactical methods,(33~35) neural networks,(36~38) expert systems(39~41) and machine learning.
Many papers have been concerned with the recognition of Latin, Chinese and Japanese characters. However, although almost a third of a billion people worldwide, in several different languages, use Arabic characters for writing, little research progress, in both on-line and off-line, has been achieved towards the automatic recognition of Arabic characters. This is a result of the lack of adequate support in terms of funding, and other utilities such as Arabic text databases, dictionaries, etc. and of course because of the cursive nature of its writing rules.
Although other surveys have dealt with both online and off-line Arabic characters,(45~47) this paper tries to summarize all the work accomplished in the past two decades in only off-line systems in an attempt to pin-point the different areas that need to be tackled. The remainder of this paper is organized as follows: Section 2 reviews some of the basic characteristics of Arabic writing. Section 3 covers different approaches for segmentation and feature extraction, and presents various methods adopted for the recognition. Finally, concluding remarks are given in Section 4.
چکیده
1. مقدمه
2. مشخصات کلی نوشتن عربی
3. تشخیص کاراکترهای عربی
3.1. تقسیم بندی کلمه
3.2 استخراج و تشخیص ویژگی
3. 3. طبقه بندهای شبکه عصبی
3. 4. روش های تصادفی
4. نتایج
منابع
Abstract
1. INTRODUCTION
2. GENERAL CHARACTERISTICS OF ARABIC WRITING
3. RECOGNITION OF ARABIC CHARACTERS
3.1. Word segmentation
3.2. Feature extraction and recognition
3.3. Neural network classifiers
3.4. Stochastic methods
4. CONCLUSIONS
REFERENCES