یک الگوریتم کارآمد و موثر برای استخراج  K الگوی برتر متناوب
ترجمه شده

یک الگوریتم کارآمد و موثر برای استخراج K الگوی برتر متناوب

عنوان فارسی مقاله: یک الگوریتم کارآمد و موثر برای استخراج K الگوی برتر متناوب
عنوان انگلیسی مقاله: An efficient and effective algorithm for mining top-rank-k frequent patterns
مجله/کنفرانس: سیستم های خبره با کاربردی آن - Expert Systems with Applications
رشته های تحصیلی مرتبط: مهندسی کامپیوتر
گرایش های تحصیلی مرتبط: مهندسی الگوریتم ها و محاسبات، مهندسی نرم افزار
کلمات کلیدی فارسی: داده کاوی، استخراج الگو، استخراج K الگوی برتر متناوب، لیست N
کلمات کلیدی انگلیسی: Data mining - Pattern mining - Top-rank-k frequent patterns - N-list
نوع نگارش مقاله: مقاله پژوهشی (Research Article)
شناسه دیجیتال (DOI): https://doi.org/10.1016/j.eswa.2014.07.045
دانشگاه: گروه علوم کامپیوتر، دانشگاه علوم، ویتنام
صفحات مقاله انگلیسی: 9
صفحات مقاله فارسی: 24
ناشر: الزویر - Elsevier
نوع ارائه مقاله: ژورنال
نوع مقاله: ISI
سال انتشار مقاله: 2015
ایمپکت فاکتور: 7.836 در سال 2019
شاخص H_index: 184 در سال 2020
شاخص SJR: 1.494 در سال 2019
ترجمه شده از: انگلیسی به فارسی
شناسه ISSN: 0957-4174
شاخص Quartile (چارک): Q1 در سال 2019
فرمت مقاله انگلیسی: PDF
وضعیت ترجمه: ترجمه شده و آماده دانلود
فرمت ترجمه فارسی: pdf و ورد تایپ شده با قابلیت ویرایش
مشخصات ترجمه: تایپ شده با فونت B Nazanin 14
مقاله بیس: خیر
مدل مفهومی: ندارد
کد محصول: 11293
رفرنس: دارای رفرنس در داخل متن و انتهای مقاله
پرسشنامه: ندارد
متغیر: ندارد
درج شدن منابع داخل متن در ترجمه: بله
ترجمه شدن توضیحات زیر تصاویر و جداول: بله
ترجمه شدن متون داخل تصاویر و جداول: خیر
رفرنس در ترجمه: در داخل متن و انتهای مقاله درج شده است
نمونه ترجمه فارسی مقاله

چکیده

استخراج  الگوهای متناوب کاندیدهای بسیاری تولید میکند که نیاز به صرف مقدار زیادی از حافظه و زمان استخراج دارد. در کاربردهای واقعی، از تعداد کمی از الگوهای متناوب استفاده می شود. بنابراین، استخراج K الگوی برتر متناوب که تعداد الگوهای متناوب استخراج شده را با رتبه بندی آنها برحسب تناوب محدود میکند، مورد توجه قرار گرفته است. این مقاله الگوریتم iNTK را پیشنهاد می کند که یک نسخه بهبود یافته از الگوریتم NTK برای استخراج K الگوی برتر متناوب است. این الگوریتم از یک ساختار N-لیست برای نشان دادن الگوها استفاده میکند. این مفهوم استنتاجی برای سرعت بخشیدن به روند استخراج K الگوی برتر مورد استفاده قرار میگیرد. آزمایش هایی برای ارزیابی iNTK و NTK برحسب زمان استخراج  و مصرف حافظه برای هشت مجموعه داده انجام گرفته است. نتایج تجربی نشان می دهد که iNTK کارآمد تر و سریعتر از NTK است.

1. معرفی

سیستم خبره یک سیستم هوشمند است که مسائل پیچیده مبتنی بر دانش  را از طریق روشهای استنتاج حل میکند. به طور کلی، سه مولفه در یک سیستم خبره وجود دارد از جمله پایگاه دانش، موتور استنتاج و رابط کاربری (Jackson ،1999). مرکز سیستم های خبره پایگاه دانش است، چراکه حاوی دانش حل مساله یک کاربرد خاص می باشد (Ahmed ، 2008). بنابراین، کاهش این فضای دانش نقش بزرگی در عملکرد اجرایی سیستم های خبره ایفا می کند. قوانین وابستگی دانش (Daniel و Viorel، 2004؛ Guil، Bosch ، Tunez ، و Marín ، 2003) که نشان دهنده روابط بین اقلام در یک مجموعه داده اند ، مهم هستند. برای ایجاد قوانین وابستگی، رویکردهای سنتی ابتدا الگوهای متناوب شامل مجموعه آیتم ها، زیردنباله ها و زیر ساختها را استخراج  میکنند که در تراکنش های بزرگ و یا مجموعه داده های رابطه ای با تناوب کمتر از یک آستانه داده شده ظاهر می شوند. پس از آن، این سیستم از این الگوهای متناوب و حداقل اطمینان برای یافتن تمام قوانین استفاده میکند. دو عبارت بالا به مقدار زیادی حافظه و زمان استخراج  نیاز دارد. بنابراین، کاهش زمان استخراج الگوهای متناوب به منظور بهبود سیستم های خبره بسیار مفید است.

6. نتیجه گیری و کارهای آینده

در این مقاله یک الگوریتم بهبودیافته کارآمد به نام iNTK برای استخراج  K الگوی برتر متناوب ارائه شد. مزیت iNTK در استفاده از N-لیست و شاخص استنتاج 1-الگوها نهفته است. N-لیست نسبت به لیست-گره اطلاعات کمتری ذخیره کرده و شاخص استنتاج به طور مستقیم به iNTK در استخراج  الگوهای متعلق به جدول K رتبه برتر حاوی 1-الگوها در مجموعه استنتاج کمک میکند. این باعث می شود که iNTK مصرف حافظه و زمان اجرای کمتری داشته باشد. آزمایش های گسترده نشان می دهد که iNTK از NTK برای مجموعه داده های مختلف بهتر عمل میکند.

نمونه متن انگلیسی مقاله

Abstract

Frequent pattern mining generates a lot of candidates, which requires a lot of memory usage and mining time. In real applications, a small number of frequent patterns are used. Therefore, the mining of top-rank-k frequent patterns, which limits the number of mined frequent patterns by ranking them in frequency, has received increasing interest. This paper proposes the iNTK algorithm, which is an improved version of the NTK algorithm, for mining top-rank-k frequent patterns. This algorithm employs an N-list structure to represent patterns. The subsume concept is used to speed up the process of mining top-rank-k patterns. The experiments are conducted to evaluate iNTK and NTK in terms of mining time and memory usage for eight datasets. The experimental results show that iNTK is more efficient and faster than NTK.

1. Introduction

An expert system is an intelligent system that solves the complex problems based on knowledge throughout inference procedures. Generally, there are three components in an expert system including knowledge base, inference engine and user interface (Jackson, 1999). The central of expert systems is the knowledge base, because it contains the problem solving knowledge of the particular application (Ahmed, 2008). Therefore, the reduction of this knowledge space plays a big role in the implemented performance of expert systems. Association rules are important of the knowledge (Daniel & Viorel, 2004; Guil, Bosch, Túnez, & Marín, 2003) which represent the relationships between items in a dataset. To generate association rules, traditional approaches first mine frequent patterns which are itemsets, subsequences, and substructures that appear in large transactions or relational datasets with a frequency no less than a given threshold. After that, the system uses these frequent patterns and the minimum confidence to find all rules. Two above phrases require a lot of memory usage and mining time. Therefore, the reduction of time to mine frequent patterns is very useful to enhance expert systems.

6. Conclusion and future work

This paper presents an efficient improvement algorithm called iNTK to mine top-rank-k frequent patterns. The advantage of iNTK lies in that it uses N-list and subsume index of 1-patterns. N-list store information shorter than Node-list and subsume index help iNTK directly mining in case of patterns belonged to top-rank-k table contain other 1-patterns in their subsume set. This causes that iNTK consume less memory and runtime. Extensive experiments show that iNTK outperforms NTK for various datasets.

تصویری از فایل ترجمه

          

(جهت بزرگ نمایی روی عکس کلیک نمایید)

ترجمه فارسی فهرست مطالب

چکیده

1. معرفی

2. کارهای مرتبط

3. تعریف مساله

3.1. الگوهای متناوب

3.2. مساله استخراج K الگوی برتر متناوب 

3.3. ساختار N-لیست

3.4. شاخص استنتاج 1-الگوهای متناوب

4. الگوریتم iNTK

4.1 تابع درج N-list

4.2. شاخص استنتاج مربوط به هر 1-الگوی متناوب

4.3. الگوریتم پیشنهادی

4.4. یک مثال روشن

5. نتایج تجربی

5.1. زمان استخراج 

5.2. مصرف حافظه

6. نتیجه گیری و کارهای آینده

فهرست انگلیسی مطالب

Abstract

1. Introduction

2. Related work

3. Problem definition

3.1. Frequent patterns

3.2. Problem of mining top-rank-k frequent patterns

3.3. N-list structure

3.4. Subsume index of frequent 1-patterns

4. iNTK algorithm

4.1. N-list intersection function

4.2. Subsume index associated with each frequent 1-pattern

4.3. The proposed algorithm

4.4. An illustrative example

5. Experimental results

5.1. Mining time

5.2. Memory usage

6. Conclusion and future work

محتوای این محصول:
- اصل مقاله انگلیسی با فرمت pdf
- ترجمه فارسی مقاله با فرمت ورد (word) با قابلیت ویرایش، بدون آرم سایت ای ترجمه
- ترجمه فارسی مقاله با فرمت pdf، بدون آرم سایت ای ترجمه
قیمت محصول: ۳۲,۷۰۰ تومان
خرید محصول