چکیده
مقدمه
دادههای متنی گسسته محلی در مجموعه دادههایی با ابعاد بالا
تجزیه و تحلیل آزمایشی
بحث و تحلیل
نتیجه گیری
منابع
Abstract
Introduction
Local Discrete Text Data in High‑Dimensional Data Sets
Experimental Analysis
Discussion and Analysis
Conclusion
References
چکیده
با هدف مشکلات دقت کم، زمان طولانی مورد نیاز و مصرف حافظه زیاد روشهای داده کاوی سنتی، یک روش داده کاوی متن گسسته محلی در فضای داده با ابعاد بالا پیشنهاد شده است. اول از همه، از طریق مرحله آمادهسازی و پیشپردازش دادهها، حداقل واگرایی دادهها را به دست میآوریم و بعد دادهها را به حداکثر میرسانیم تا تقاضا برای داده در فضای با ابعاد بالا را برآورده کنیم. دوم، ما از روش به دست آوردن اطلاعات برای استخراج داده های متن گسسته از پیش پردازش شده برای ایجاد یک تابع هدف برای به دست آوردن بالاترین سود اطلاعات استفاده می کنیم. در نهایت، توابع هدف ایجاد شده در آمادهسازی دادهها، پیشپردازش، و استخراج با یکدیگر ترکیب میشوند تا یک مسئله بهینهسازی چند هدفه را برای تحقق بخشیدن به دادهکاوی متن گسسته محلی تشکیل دهند. نتایج آزمایش شبیهسازی نشان میدهد که روش ما به طور موثر زمان را کاهش میدهد و دقت دادهکاوی را بهبود میبخشد، جایی که حافظه کمتری مصرف میکند، که نشان میدهد روش بهینهسازی چند هدفه میتواند به طور موثر چندین مشکل را حل کند و اثر داده کاوی را به طور موثر بهبود بخشد.
توجه! این متن ترجمه ماشینی بوده و توسط مترجمین ای ترجمه، ترجمه نشده است.
Abstract
Aiming at the problems of low accuracy, the long time required, and the large memory consumption of traditional data mining methods, a local discrete text data mining method in high-dimensional data space is proposed. First of all, through the data preparation and preprocessing step, we obtain the minimum data divergence and maximize the data dimension to meet the demand for data in high-dimensional space; second, we use the information gain method to mine the pre-processed discrete text data to establish an objective function to obtain the highest information gain; finally, the objective functions established in data preparation, preprocessing, and mining are combined to form a multi-objective optimization problem to realize local discrete text data mining. The simulation experiment results show that our method effectively reduces the time and improves the accuracy of data mining, where it also consumes less memory, indicating that the multi-objective optimization method can effectively solve multiple problems and effectively improve the data mining effect.
Introduction
Against the background of the rapid development of network technology and the continuous increase in users, the amount of data both in reality and in network presents an exponential rising trend. In the face of massive data, how to find the required data has become a hot issue in current research in relevant fields [1]. How to obtain the law of data generation and development through mining and processing a large amount of data, and extract valuable information from it, has positive significance for the improvement of data application [2, 3]. Among various data types, there are not only normal data, but also some discrete data, which have certain limitations in collection, classification, retrieval, and mining due to their own particularities [4]. Therefore, to realize the effective mining of local discrete text data, it must be further processed.
Conclusion
In the era of big data, mining and applying effective information with the explosive growth of data is the key link to improving the quality of data use. However, when facing special data types, traditional methods often cannot show the consumption of mining performance. Therefore, this paper proposes a local data mining method in high-dimensional data space. This method improves the efficiency of data mining through discrete text data preprocessing, and improves the accuracy of local discrete text data mining through multi-objective optimization. The results show that the data mining accuracy of this method is relatively high, the data mining time is short, and the memory capacity consumed is the least. The application value of this method is the highest.