چکیده
در سال های اخیر، فراهم آورندگان خدمات IT به سرعت به مدل تحویل خدمات خودکار دست یافته اند. سیستم های نظارت خدمات طوری طراحی شده اند که به صورت فعالانه وقوع ایونت را جمع آوری کنند و آن را هشدار دهند و زمانی که لازم است به صورت خودکار ticket های رویداد را ایجاد کنند. ایونت های مکرر منجر به ایجاد ticket های مشابه می شود که به نوبه ی خود تعداد زیادی از تصمیم گیری های مشکل مکرر را داراست که احتمالا در ticket های پیشین یافت می شود. در این مقاله، با استفاده از شباهت های بین ایونت و تصمیم گیری های تاریخی ایونت های مشابه، تکنیک هایی برای توصیه ی تصمیم گیری مناسب برای ایونت های ورودی توسعه می دهیم. بر اساس الگوریتم سنتی نزدیک ترین همسایه k، الگوریتم های پیشنهادیمان مثبت های کاذبی را که اغلب توسط سیستم های نظارتی ایجاد می شوند در نظر می گیرند. یک اخطار اضافی در الگوریتم ها قرار گرفته است تا تعداد تصمیم گیری های گمراه کننده در نتایج توصیه شده را کنترل کند. علاوه بر این، از آنجاییکه اثربخشی الگوریتم نزدیک ترین همسایه k به شدت بر مقیاس های شباهت نفهته متکی است، دو رویکرد دیگر پیشنهاد می کنیم تا به طور قابل توجهی توصیه مان با توجه به ارتباط تصمیم گیری بهبود بخشد. یک رویکرد از ویژگی های در سطح موضوع استفاده می کند تا اطلاعات تصمیم گیری را در مقیاس شباهت ادغام کند، و دیگری از یادگیری متریک برای دانستن مقیاس شباهت موثر تر استفاده می کند. ارزیابی های تجربی گسترده بر سه مجموعه داده های ticket نشان دهنده ی اثربخشی و کارایی روش های پیشنهادیمان است.
1. مقدمه
جو رقابتی تجارت و پیچیدگی محیط های خدمات نیاز تحویل و پشتیبانی مقرون به صرفه و کارآمد خدمات را الزام میدارد. آن ها عمدتا از طریق امکانات فراهم آورنده ی خدمات بدست می آیند که با ابزار مدیریت سیستم که با خودکارسازی روند نگهداری روزمره مانند ردیابی مشکل، تعیین و تصمیم گیری برای زیرساخت خدمات ترکیب شده اند، همکاری می کنند (1)، (2)،(3)، (4)،(5).ردیابی خودکار مشکل به طور معمول توسط نرم افزار نظارت مانند IBM Tivoli Monitoring (6) و HP OpenView (7) درک می شود. نظارت به طور مداوم ایونت ها را دریافت می کند و ticket های ایونت را زمانی که هشدار ایجاد شود، تولید می کند. استقرار راه حل های نظارت گام نخست به سمت تحویل کاملا خودکار خدمات است. با این وجود، تصمیم گیری خودکار مشکل سخت است.
Abstract
In recent years, IT service providers have rapidly achieved an automated service delivery model. Software monitoring systems are designed to actively collect and signal event occurrences and, when necessary, automatically generate incident tickets. Repeating events generate similar tickets, which in turn have a vast number of repeated problem resolutions likely to be found in earlier tickets. In our work, we develop techniques to recommend appropriate resolution for incoming events by making use of similarities between the events and historical resolutions of similar events. Built on the traditional K Nearest Neighbor algorithm, our proposed algorithms take into account false positives often generated by monitoring systems. An additional penalty is incorporated into the algorithms to control the number of misleading resolutions in the recommendation results. Moreover, as the effectiveness of the K Nearest Neighbor algorithm heavily relies on the underlying similarity measurement, we proposed two other approaches to significantly improve our recommendation with respect to resolution relevance. One approach uses topic-level features to incorporate resolution information into the similarity measurement; and the other uses metric learning to learn a more effective similarity measure. Extensive empirical evaluations on three ticket data sets demonstrate the effectiveness and efficiency of our proposed methods.
1 INTRODUCTION
The competitive business climate and the complexity of service environments dictate the need for efficient and costeffective service delivery and support. They are largely achieved through service-providing facilities that collaborate with system management tools, combined with automation of routine maintenance procedures, such as problem detection, determination and resolution for the service infrastructure [1], [2], [3], [4], [5]. Automatic problem detection is typically realized by system monitoring software, such as IBM Tivoli Monitoring [6] and HP OpenView [7]. Monitoring continuously captures the events and generates incident tickets when alerts are raised. Deployment of monitoring solutions is a first step towards fully automated delivery of a service. Automated problem resolution, however, is a hard problem.
چکیده
1.مقدمه
2. پیشینه
2.1. زیرساخت خدمات خودکار ticket های نظارتی و ایونت
2.2. تصمیم گیری های پی در پی ticket های نظارتی
3. توصیه تصمیم گیری
3.1. بیان مسئله
3.2. مروری بر الگوریتم های پیشنهادی
3.3. توصیه مبتنی بر KNN اساسی
4. بسط و گسترش به منظور حذف تصمیم گیری های گمراه کننده
4.1. روش تقسیم
4.2. روش فیوژن احتمالی
4.3. پیش بینی نوع ticket
5. بسط و گسترش به منظور بهبود دقت و درستی
5.1. نمایش ticket های نظارتی
5.2. ادغام اطلاعات تصمیم گیری
5.3. یادگیری متریک
6. پیاده سازی
7. ارزیابی
7.1. داده های تجربی
7.2. متریک ارزیابی
7.3. عملکرد توصیه کلی
8. کارهای مرتبط
9. نتیجه گیری