چکیده
مسئله طراحی دستهبندیکنندههای ماشین بردار پشتیبان (SVM) با استفاده از الگوریتم اصلاحشده بهینهسازی ازدحام ذرات (PSO) و مجموعههای آنها در این مطالعه مورد بررسی قرار گرفته است. حل این مسئله امکان اجرای دستهبندی دادهها با دقت بالا به خصوص دستهبندی دادههای بزرگ (Big Data) را با صرف زمان قابلقبول فراهم میسازد. الگوریتم اصلاحشده PSO به جستجوی همزمان نوع توابع هسته، پارامترهای تابع هسته و ارزش پارامتر تنظیم در دستهبندیکننده SVM میپردازد. طرح بازتولید ذرات به عنوان مبنای الگوریتم اصلاحشده PSO عمل نموده است. در پیادهسازی این الگوریتم، برخی ذرات، نوع تابع هسته خود را به تابعی که با ببشترین دقت دستهبندی با ذره مطابقت میکند، تغییر میدهند. الگوریتم ارائهشده PSO امکان کاهش مدت زمان صرفشده برای دستهبندیکنندههای طراحیشده SVM که برای مسئله دستهبندی دادههای بزرگ بسیار مهم است، فراهم میسازد. در اکثر موارد، اینگونه دستهبندیکننده SVM کیفیت بالایی از دستهبندی دادهها را ارائه میدهد. در موارد استثنایی میتوان از مجموعههای SVM مبتنی بر الگوریتم بیشینهسازی غیرهمبستگی برای راهبردهای مختلف تصمیمگیری در مورد دستهبندی دادهها و قاعده رأی اکثریت استفاده کرد. علاوه بر این، دستهبندیکننده دوسطحی SVM نیز ارائه شده است. ایننوع دستهبندیکننده به عنوان گروه دستهبندیکنندههای SVM در سطح اول و به عنوان دستهبندیکننده SVM بر مبنای الگوریتم اصلاحشده PSO در سطح دوم عمل میکند. نتایج مطالعات آزمایشگاهی بر اثربخشی روشهای ارائهشده جهت دستهبندی دادههای بزرگ مهر تأیید میزند.
Abstract
The problem with development of the support vector machine (SVM) classifiers using modified particle swarm optimization (PSO) algorithm and their ensembles has been considered. Solving this problem would allow fulfilling the highprecision data classification, especially Big Data classification, with the acceptable time expenditures. The modified PSO algorithm conducts a simultaneous search of the type of kernel functions, the parameters of the kernel function and the value of the regularization parameter for the SVM classifier. The idea of particles' «regeneration» served as the basis for the modified PSO algorithm. In the implementation of this algorithm, some particles change the type of their kernel function to the one which corresponds to the particle with the best value of the classification accuracy. The offered PSO algorithm allows reducing the time expenditures for the developed SVM classifiers, which is very important for Big Data classification problem. In most cases such SVM classifier provides the high quality of data classification. In exceptional cases the SVM ensembles based on the decorrelation maximization algorithm for the different strategies of the decision-making on the data classification and the majority vote rule can be used. Also, the two-level SVM classifier has been offered. This classifier works as the group of the SVM classifiers at the first level and as the SVM classifier on the base of the modified PSO algorithm at the second level. The results of experimental studies confirm the efficiency of the offered approaches for Big Data classification.
چکیده
1.مقدمه
2. دستهبندیکننده ماشین بردار پشتیبان
3. الگوریتم اصلاح شده بهینهسازی ازدحام ذرات
4. مجموعه ماشین بردار پشتیبان
5. دستهبندیکننده دوسطحی ماشین بردار پشتیبان
6. مطالعات آزمایشی
Abstract
I. INTRODUCTION
II. THE SUPPORT VECTOR MACHINE CLASSIFIER
III. THE MODIFIED PARTICLE SWARM OPTIMIZATION ALGORITHM
IV. THE SUPPORT VECTOR MACHINE ENSEMBLE
V. V. TWO-LEVEL SVM CLASSIFIER
VI. EXPERIMENTAL STUDIES
VII. CONCLUSION