ساخت سلسله مراتب و دسته بندی متن بر مبنای استراتژی آزاد سازی
ترجمه شده

ساخت سلسله مراتب و دسته بندی متن بر مبنای استراتژی آزاد سازی

عنوان فارسی مقاله: ساخت سلسله مراتب و دسته بندی متن بر مبنای استراتژی آزاد سازی و مدل حداقل اطلاعات
عنوان انگلیسی مقاله: Hierarchy construction and text classification based on the relaxation strategy and least information model
مجله/کنفرانس: سیستم های خبره با کاربردهای آن - Expert Systems With Applications
رشته های تحصیلی مرتبط: مهندسی فناوری اطلاعات
گرایش های تحصیلی مرتبط: مدیریت سیستم های اطلاعات
کلمات کلیدی فارسی: دسته بندی سلسله مراتب، استراتژی آزاد سازی، نظریه حداقل اطلاعات، وزن دهی واژه
کلمات کلیدی انگلیسی: Hierarchy classification - Relaxation strategy - Least Information Theory - Term weighting
نوع نگارش مقاله: مقاله پژوهشی (Research Article)
شناسه دیجیتال (DOI): https://doi.org/10.1016/j.eswa.2018.02.003
دانشگاه: دانشکده فناوری اطلاعات ، دانشگاه صنعتی پکن ، چین
صفحات مقاله انگلیسی: 8
صفحات مقاله فارسی: 20
ناشر: الزویر - Elsevier
نوع ارائه مقاله: ژورنال
نوع مقاله: ISI
سال انتشار مقاله: 2018
ایمپکت فاکتور: 5.891 در سال 2018
شاخص H_index: 162 در سال 2019
شاخص SJR: 1.190 در سال 2018
ترجمه شده از: انگلیسی به فارسی
شناسه ISSN: 0957-4174
شاخص Quartile (چارک): Q1 در سال 2018
فرمت مقاله انگلیسی: PDF
وضعیت ترجمه: ترجمه شده و آماده دانلود
فرمت ترجمه فارسی: ورد و pdf
مشخصات ترجمه: تایپ شده با فونت B Nazanin 14
مقاله بیس: خیر
مدل مفهومی: ندارد
کد محصول: 10089
رفرنس: دارای رفرنس در داخل متن و انتهای مقاله
پرسشنامه: ندارد
متغیر: دارد
درج شدن منابع داخل متن در ترجمه: بله
ترجمه شدن توضیحات زیر تصاویر و جداول: بله
ترجمه شدن متون داخل تصاویر و جداول: بله
رفرنس در ترجمه: در داخل متن و انتهای مقاله درج شده است
نمونه ترجمه فارسی مقاله

چکیده

 دسته بندی سلسله مراتب رویکردی مؤثر برای دسته بندی داده های متنی بزرگ مقیاس است. ما یک استراتژی آزاد سازی شده روش دسته بندی سلسله مراتبی مرسوم را به منظور بهبود عملکرد سیستم معرفی می کنیم. روش ما در حین فرایند ساخت سازه سلسله مراتبی داوری گره دسته نامعین را تا زمانی که به وضوح بتوان آن را دسته بندی کرد به تأخیر می اندازد. این رویکرد مسئله «انسداد» را به صورت مؤثری کاهش می دهد که در سازه سلسله مراتبی خطای دسته بندی را از سطح بالاتر به سطح پایین تر انتقال می دهد. یک رویکرد وزن دهی واژه جدید بر مبنای نظریه حداقل اطلاعات (LIT) برای دسته بندی سلسله مراتب اتخاذ شده است. این رویکرد اطلاعات را در تغییرات توزیع احتمال تعیین می کند و مدل نمایش سند جدیدی را ارائه می کند که در آن می توان مشارکت هر واژه را به صورت صحیح وزن داد. نتایج آزمایشگاهی نشان می دهد که رویکرد آزاد سازی سلسله مراتب معقول تری ایجاد می کند و عملکرد دسته بندی را بیشتر بهبود می بخشد. این رویکرد همچنین در مقایسه با روش های دسته بندی دیگر مانند SVM (ماشین بردار پشتیبان) عملکرد بهتری بر حسب کارایی دارد و برای وظایف دسته بندی متن بزرگ مقیاس کارآمدتر است. روش های مبتنی بر LIT در مقایسه با روش وزن دهی واژه کلاسیک TF*IDF به بهبود قابل توجهی در عملکرد دسته بندی دست می یابد. 

1- مقدمه

وظیفه دسته بندی متن تخصیص دسته ای از پیش تعریف شده به یک سند متنی آزاد است. با وجود روز افزون اطلاعات متنی آنلاین سازماندهی سلسه مراتبی سندهای متنی برای مدیریت داده ها اهمیت فزاینده ای می یابد. تحقیق روی دسته بندی خودکار سندها برای دسته بندی در سلسله مراتب لازم است. 

بیشتر رده بند ها در فضای مسطح یکسانی تصمیم گیری می کنند. عملکرد دسته بندی با مجموعه داده های با مقیاس بزرگتر و دسته های بیشتر، به ویژه بر حسب زمان دسته بندی، به سرعت کاهش می یابد. از سوی دیگر یک روش دسته بندی سلسله مراتبی تمام دسته ها را در سازه ای درخت مانند دسته بندی می کند و یک رده بند را روی هر گره در سلسله مراتب آموزش می دهد. فرایند دسته بندی از ریشه درخت تا زمان رسیدن به گره برگ آغاز می شود که این گره دسته نهایی سند را مشخص می کند. 

نمونه متن انگلیسی مقاله

Abstract

Hierarchical classification is an effective approach to categorization of large-scale text data. We introduce a relaxed strategy into the traditional hierarchical classification method to improve the system performance. During the process of hierarchy structure construction, our method delays node judgment of the uncertain category until it can be classified clearly. This approach effectively alleviates the ‘block’ problem which transfers the classification error from the higher level to the lower level in the hierarchy structure. A new term weighting approach based on the Least Information Theory (LIT) is adopted for the hierarchy classification. It quantifies information in probability distribution changes and offers a new document representation model where the contribution of each term can be properly weighted. The experimental results show that the relaxation approach builds a more reasonable hierarchy and further improves classification performance. It also outperforms other classification methods such as SVM (Support Vector Machine) in terms of efficiency and the approach is more efficient for large-scale text classification tasks. Compared to the classic term weighting method TF*IDF, LIT-based methods achieves significant improvement on the classification performance.

1. Introduction

The task of text classification is to assign a predefined category to a free text document. With more and more textual information available online, hierarchical organization of text documents is becoming increasingly important to manage the data. The research on automatic classification of documents to the categories in the hierarchy is needed.

Most of the classifiers make the decision in the same flat space. Classification performance degrades quickly with larger scale data sets and more categories, especially in terms of the classification time. On the other hand, a hierarchical classification method organizes all of the categories into a tree like structure and trains a classifier on each node in the hierarchy. The classification process begins from the root of the tree until it reaches the leaf node which denotes the final category for the document.

ترجمه فارسی فهرست مطالب

چکیده

1- مقدمه

2- کارهای مرتبط

3- ساخت سلسله مراتب با استراتژی آزاد سازی

3-1 روش آزاد سازی

3-2 الگوریتم برای ساخت سلسله مراتب

4- دسته بندی سلسله مراتبی بر مبنای نظریه حداقل اطلاعات برای وزن دهی واژه

4-1 مدل حداقل اطلاعات برای وزن دهی واژه

4-2 آموزش رده بند روی سازه سلسله مراتبی

5- ارزیابی آزمایشگاهی

5-1 مجموعه های داده

5-2 نتیجه ارزیابی

5-3 بحث

6- نتایج

منابع

فهرست انگلیسی مطالب

Abstract

1. Introduction

2. Related work

3. Hierarchy construction with relaxation strategy

3.1. Relaxation method

3.2. Algorithm for hierarchy construction

4. Hierarchical classification based on the Least Information Theory for term weighting

4.1. Least information model for term weighting

4.2. Classifier training on the node of the hierarchical structure

5. Experimental evaluation

5.1. Data sets

5.2. Evaluation result

5.3. Discussion

6. Conclusions

محتوای این محصول:
- اصل مقاله انگلیسی با فرمت pdf
- ترجمه فارسی مقاله با فرمت ورد (word) با قابلیت ویرایش، بدون آرم سایت ای ترجمه
- ترجمه فارسی مقاله با فرمت pdf، بدون آرم سایت ای ترجمه
قیمت محصول: ۳۳,۲۰۰ تومان
خرید محصول