چکیده
در تحقیق راجع به تکنیک های تشخیص نفوذ، مجموعه داده KDD به عنوان یک محک و معیار معروف، شناخته شده است. درراستای بهبود استراتژیهای تشخیص نفوذ، کارهای زیادی در حال انجام است، در حالیکه تحقیق پیرامون داده های استفاده شده جهت آموزش و آزمایش مدل تشخیص، به یک اندازه اهمیت دارد، زیرا کیفیت بهتر داده ها، تشخیص نفوذ برون خطی (آفلاین) را بهبود می بخشد. در این مقاله، مجموعه داده KDD با توجه به چهار کلاس پایه، محتوا، ترافیک و میزبان مورد آنالیز قرار می گیرد، که همه مشخصه های داده ها را می توان در آنها طبقه بندی نمود. آنالیز با توجه به دو متریک ارزیابی مهم یعنی نرخ تشخیص (DR) و نرخ آلارم اشتباه (FAR) برای سیستم تشخیص نفوذ (IDS) انجام شده است. در نتیجه این آنالیز تجربی روی مجموعه داده، سهم هر یک از چهار کلاس مشخصه ها در DR و FAR نشان داده شده است، که به بهبود تناسب مجموعه داده جهت نیل به ماکزیمم DR با مینیموم FAR کمک می نماید.
1. مقدمه
این روزها با رشد چند بعدی شدن کاربرد شبکه به خاطر افزایش استفاده از وسایل دستی، امنیت شبکه به عنوان مهمترین موضوع شناخته شده است. سیستم های تشخیص نفوذ به تشخیص مقاصد خرابکارانه کاربران شبکه کمک می نمایند بدون اینکه امنیت میزبان و شبکه را به خطر بیندازند. الگوریتم های یادگیری ماشینی زیادی موجود است که از داده های آموزشی یادگرفته و زمانی که در معرض داده های آموزش ندیده جدید قرار می گیرند، به صورت تعمیم پذیر ظاهر می شوند.دو نوع تکنیک تشخیص نفوذ وجود دارد، یکی تشخیص سوء استفاده که می تواند حملات شناخته شده را بدست آورد و به همین خاطر روی داده های آفلاین یا برون خطی کار می کند و دیگری تشخیص آنومالی که قادر به تشخیص هرگونه رفتار غیر عادی است وبه همین خاطر روی داده های آنلاین یا روخطی کار می کند. مجموعه داده KDD، یک مجموعه داده استاندارد است که برای تحقیق پیرامون سیستم های تشخیص نفوذ استفاده می شود.
Abstract
The KDD data set is a well known benchmark in the research of Intrusion Detection techniques. A lot of work is going on for the improvement of intrusion detection strategies while the research on the data used for training and testing the detection model is equally of prime concern because better data quality can improve offline intrusion detection. This paper presents the analysis of KDD data set with respect to four classes which are Basic, Content, Traffic and Host in which all data attributes can be categorized. The analysis is done with respect to two prominent evaluation metrics, Detection Rate (DR) and False Alarm Rate (FAR) for an Intrusion Detection System (IDS). As a result of this empirical analysis on the data set, the contribution of each of four classes of attributes on DR and FAR is shown which can help enhance the suitability of data set to achieve maximum DR with minimum FAR.
1. Introduction
Network security1 is a foremost issue these days as the network usage is growing in multi-dimensions due to increased use of handheld devices. Intrusion Detection Systems can help detect malign intentions of network users without compromising the security of the host and the network. There are many machine learning algorithms available which can learn from the training data and can generalize when exposed to new untrained data. There are two types of intrusion detection technique, the first one is Misuse Detection that can catch the known attacks and hence works on the offline data2 and the other is Anomaly Detection which can detect any abnormal behavior and hence can work well on online data3 . The KDD data set is a standard data set used for the research on intrusion detection systems.
چکیده
1. مقدمه
1. 1 مجموعه داده KDD
2. 1 هدف
3. 1 کارهای مرتبط
2. راه اندازی آزمایش
1. 2 روش تحقیق
2. 2 Weka
3. 2 طبقه بند استفاده شده
4. 2 متریک ها
3. نتایج شبیه سازی
4. بحث
5. نتیجه گیری
ضمیمه A
منابع
Abstract
1. Introduction
1.1. KDD Data Set
1.2. Objective
1.3. Related Work
2. Experimental Setup
2.1. Research Methodology
2.2. Weka
2.3. Used Classifier
2.4. Metrics
3. Simulation Results
4. Discussions
5. Conclusion
Appendix A.