چکیده
پیشینه: الگوریتم جدیدی به نام فایل پیکره بندی بازیابی اطلاعات برای استخراج اطلاعات مفید از مجموعه رزومه ها در طول استخراج پیشنهاد شده است که اطلاعات بدست آمده به نیازهای تجارت ربط داشته و کارآمد می باشد.
روشها: تحلیل دستی داده های متنی غیر ساختاریافته عملی نیست، بنابراین روشهای متن کاوی متعددی برای خودکار نمودن فرایند تحلیل داده های غیر ساختاریافته با استفاده از تکنیک جدیدی به نام روش رتبه بندی وزندار توسعه یافته است. نتیجه: کارایی فرایند استخدام در جریان بازیابی اطلاعات از داده های غیر ساختار یافته بهبود می یابد. کاربرد: در شرکت ها برای بهبود حدود فرایند استخدام با استفاده از الگوریتم متن کاوی جهت کاوش داده ها.
1. مقدمه
داده کاوی که همچنین معروف به کاوش دانش است، به فرایند استخراج یا کاوش اطلاعات ضروری از مقدار وسیعی از داده ها گفته می شود. ازآن عمدتاً در استخراج اطلاعات از الگوی مرتب شده استفاده می شود. در اکثر تجارتها، داده ها پیچیده بوده و در فرمت های متفاوتی وجود داشته و اغلب به شیوه ای ضعیف مثلاً به شیوه ای نامرتب ، سازماندهی شده اند. از این منابع، داده کاوی به تنهایی نمی تواند برای استخراج اطلاعات مفید، کارآمد باشد. برای استخراج متن ضروری از این اسناد متنی، از ابزار قدرتمند جدیدی به نام متن کاوی استفاده شده است.
Abstract
Background: A novel algorithm named Information Retrieval configuration file is proposed to extract useful information from a set of resumes during extraction where the information gained is relevant and efficient for business needs. Methods: Manual analysis of this unstructured textual data is impractical, so numerous text mining methods are being developed to automate the process of analyzing this unstructured data employs a new technique named Weighted Ranking method. Result: The efficiency of recruitment process is improved while retrieving the information from the unstructured data. Application: In firms to improves the scope of the recruitment process using text mining algorithm to mine the data.
1. Introduction
Data mining also known as Knowledge Discovery is the process of extracting or mining essential information from the vast amount of data. It is most commonly used in extracting information from ordered pattern. In major business, data are complex in nature and exist in deferent formats and often organized in a poorly manner i.e. in an unordered manner. From these sources, the data mining alone cannot be efficient to extract the useful information. In order to extract the essential text from these textual documents, a new powerful tool has been used called Text Mining.
چکیده
1. مقدمه
2. صورت مسئله
3. روش پیشنهادی
1. 3 فایل پیکره بندی
2. 3 الگوریتم متن کاوی IRCF
3. 3 الگوریتم رتبه بندی وزندار
4. نتیجه آزمایش
1. 4 رزومه نمونه
5. یافته ها و تحلیل
6. نتیجه گیری
Abstract
1. Introduction
2. Problem Statements
3. . Proposed Method
3.1 Configuration File:
3.2 IRCF Text Mining Algorithm
3.3 Weighted Ranking Algorithm
4. Experimental Result
4.1 Sample Resume
5. Findings and Analysis
6. Conclusion
7. References