چکیده
در محیط های خدمات فناوری اطلاعات در مقیاس وسیع و پیچیده، یک رویداد مشکل ساز به عنوان تیکت ثبت شده است و شامل خلاصه ی تیکت می باشد (وضعیت سیستم و شرح مشکل).مدیران سیستم زمانی که (مشکل) چنین تیکت هایی برطرف می شوند، به توصیف گام به گام وضوح (تفکیک) می پردازند. رویدادهای خدمات مکرر به احتمال زیاد با استنباط تیکت های تاریخی مشابه حل می شوند. با در دسترس بودن پایگاه داده های بسیار بزرگ تیکت، می توانیم سیستم خودکاری برای توصیه ی بهترین وضوح (تفکیک) مرتبط برای خلاصه تیکت داده شده داشته باشیم. در این مقاله، ابتدا چالش های تحلیل تیکت در جهان واقعی را شناسایی کرده و چارچوب یکپارچه ای برای کنترل کارآمد آن چالش ها گسترش می دهیم. این چارچوب در وهله ی نخست کیفیت وضوح (تفکیک) تیکت را با استفاده از مدل رگرسیون که بر اساس ویژگی های دقیقی طراحی شده اند، تعیین می کند. تیکت ها، به همراه امتیازات کیفیت بدست آمده از تعیین کمیت کیفیت وضوح مورد استفاده قرار می گیرند تا مدل رتبه بندی شبکه عصبی عمیقی را آموزش دهد که امتیازات جفت های خلاصه تیکت و وضوح را به عنوان خروجی ایجاد کند. این مدل رتبه بندی به ما این امکان را می دهد که کیفیت وضوح در تیکت های تاریخی را به عنوان اهرم مورد استفاده قرار دهیم درست زمانی که وضوح برای تیکت حادثه آتی توصیه می شود. بعلاوه، بردارهای ویژگی نشات گرفته از مدل رتبه بندی عصبی عمیق می تواند به طور موثری در دیگر وظایف تحلیل تیکت مانند طبقه بندی و خوشه بندی تیکت مورد استفاده قرار گیرد. چارچوب پیشنهادی به طور گسترده با مجموعه داده های جهان واقعی ارزیابی می شوند.
1. مقدمه
برتری ارائه خدمات کارآمد و مقرون به صرفه و پشتیبانی در شرکت تجارت رقابتی غیرقابل انکار است و با پیچیدگی در حال رشد محیط های خدمات اساسی است. این امکانات و تسهیلات فراهم آورنده ی خدمات را برانگیخته است تا بسیاری از وظایف شان شامل مدیریت سیستم، و روند تعمیر و نگهداری موارد روزمره (برای مثال ردیابی مشکل، تعیین و وضوح (تفکیک)) برای زیرساخت خدمات را به صورت خودکار در آورند (4،19،34). ردیاب مشکل اتوماتیک توسط نرم افزار های نظارت سیستم مانند HP Open View و IBM Tivoli Monitoring شناسایی شده است. چنین سیستم های نظارتی ای دائما رویدادهای سیستم را بررسی می کنند و زمانی که هشدارها فعال شدند، تیکت رویداد را ایجاد می کنند. گردش کار معمولی از ردیاب مشکل، تعیین و وضوح (تفکیک) در مدیریت خدمات فناوری اطلاعات توسط مشخصات کتابخانه ی زیرساخت فناوری اطلاعات (ITIL) توصیه شده است و در شکل 1 به تصویر کشیده شده است. سیستم حادثه، مشکل و تغییر (IPC) ردیابی، تحلیل و کاهش مشکلات را تسهیل می بخشد و برای سازمان هایی که چارچوب ITIL اتخاذ می کنند ضروری است. آژانس نظارتی بر روی یک سرور، آمار سیستم را ردیابی می کند و زمانی که مشکلی شناسایی شود هشداری را فعال می سازد. اگر هشداری فراتر از مدت زمان مشخص شده ادامه یابد، رویدادی فعال است (رخ داده است). چنین رویدادهایی در کنسول سازمانی تقویت می شوند که از موتورهای مبتنی بر قانون، مبتنی بر مورد یا مبتنی بر دانش استفاده می کند تا رویدادها را تحلیل و تعیین کند که آیا باید تیکت تصادفی در سیستم IPC ایجاد کند یا نه (16). هر تیکت به عنوان رکورد (مدرک ثبت شده) پایگاه داده ها ذخیره می شود و شامل چندین ویژگی مرتبط (برای ویژگی های اصلی به جدول شماره 1 رجوع کنید) و مقادیرشان به همراه حالت سیستم در زمانی که این تیکت تولید شد، می باشد. برخی از ویژگی های اصلی مانند خلاصه تیکت ( ایجاد شده توسط جمع آوری حالت سیستم و در برگرفتن شرح مشکل) و وضوح (تفکیک) تیکت ( توصیف متنی راه حل) برای تشخیص و حل تیکت های مشابه اساسی هستند. ارائه دهندگان خدمات برای هر ذی نفع که از خدمات بر زیرساخت IT مشترک استفاده می کند، حساب کاربری ای فراهم می کند. مدیران سیستم از تیکت های تاریخی و وضوح (تفکیک) شان از حساب های متفاوت برای تشخیص و وضوح (تفکیک) استفاده می کنند. توصیف متنی مراحل انجام شده در حل تیکت توسط مدیر سیستم ثبت می شود. چنین فرآیند انسانی فشرده ای از لحاظ زمان وضوح (تکفیک) و هزینه برای فراهم آورندگان خدمات IT مقیاس بزرگ که هر روزه تعداد زیادی تیکت را مورد بررسی قرار می دهند، کاملا ناکارآمد است. این یکی از انگیزه های اصلی در پس تحلیل خودکار وضوح (کیفیت) تیکت است.
ABSTRACT
In large scale and complex IT service environments, a problematic incident is logged as a ticket and contains the ticket summary (system status and problem description). The system administrators log the step-wise resolution description when such tickets are resolved. The repeating service events are most likely resolved by inferring similar historical tickets. With the availability of reasonably large ticket datasets, we can have an automated system to recommend the best matching resolution for a given ticket summary. In this paper, we first identify the challenges in real-world ticket analysis and develop an integrated framework to efficiently handle those challenges. The framework first quantifies the quality of ticket resolutions using a regression model built on carefully designed features. The tickets, along with their quality scores obtained from the resolution quality quantification, are then used to train a deep neural network ranking model that outputs the matching scores of ticket summary and resolution pairs. This ranking model allows us to leverage the resolution quality in historical tickets when recommending resolutions for an incoming incident ticket. In addition, the feature vectors derived from the deep neural ranking model can be effectively used in other ticket analysis tasks, such as ticket classification and clustering. The proposed framework is extensively evaluated with a large real-world dataset.
1 INTRODUCTION
The prominence of efficient and cost-effective service delivery and support is undeniable in the competitive business enterprise and is critical with the growing complexity of service environments. This has motivated service-providing facilities to automate many of their tasks, including system management, and routine maintenance procedures (for instance, problem detection, determination and resolution) for the service infrastructure [4, 19, 34]. The automated problem detection has been realized by some system monitoring softwares, such as HP OpenView 1 and IBM Tivoli Monitoring 2 . Such monitoring systems continuously capture system events and generate incident tickets when the alerts are triggered. A typical workflow of problem detection, determination and resolution in IT service management is prescribed by the Information Technology Infrastructure Library (ITIL) specification 3 and is illustrated in Fig. 1. The Incident, Problem, and Change (IPC) system facilitates the tracking, analysis and mitigation of problems and is a requirement for organizations adapting the ITIL framework. A monitoring agent on a server keeps track of the system statistics and triggers an alert when a problem is detected. If an alert persists beyond the specified duration, an event is triggered. Such events are consolidated into an enterprise console, which uses rule-based, case-based or knowledge-based engines to analyze the events and determines whether or not to create an incident ticket in the IPC system [16]. Each ticket is stored as a database record that consists of several related attributes (see Table 1 for the major attributes) and of their values along with the system status at the time this ticket was generated. Some of the major attributes, such as the ticket summary (created by the aggregation of the system status and containing the problem description) and the ticket resolution (the textual description of the solution) are critical for diagnosing and resolving similar tickets. Service providers provide an account for every beneficiary that uses the services on a common IT infrastructure. System administrators use the historical tickets and their resolutions from different accounts for problem diagnosis and resolution. The textual description of steps taken to resolve a ticket is logged by the system administrator. Such a human intensive process is quite inefficient in terms of resolution time and cost for large IT service providers that handle many tickets every day. This is one of the major motivations behind the automated analysis of ticket resolution.
چکیده
1.مقدمه
1.1. چالش ها و راه حل های پیشنهادی
1.2. تحقیقات مرتبط
1.3. نقشه راه (آنچه در ادامه مقاله است)
2. مرور و بررسی
3. تعیین کمیت کیفیت وضوح تیکت
3.1. توصیف ویژگی
3.2. یافته ها
4. مدل رتبه بندی عصبی عمیق
4.1. فرمول بندی مشکل
4.2. معماری رتبه بندی عصبی عمیق
4.3. تنظیم
4.4. تعبیه کلمه
5. خودکارسازی وضوح تیکت
5.1. مجموعه داده ها
5.2. خودکارسازی وضوح تیکت
6. دیگر برنامه های کاربردی تحلیل تیکت
6.1. خوشه بندی تیکت
6.2. طبقه بندی تیکت
7. نتیجه گیری
ABSTRACT
1 INTRODUCTION
1.1 Challenges and Proposed Solutions
1.2 Related Research
1.3 Road Map
2 OVERVIEW
3 TICKET RESOLUTION QUALITY QUANTIFICATION
3.1 Feature Description
3.2 Findings
4 DEEP NEURAL RANKING MODEL
4.1 Problem formulation
4.2 Deep Neural Ranking Architecture
4.3 Regularization
4.4 Word Embedding
5 AUTOMATING TICKET RESOLUTION
5.1 Datasets
5.2 Ticket Resolution Automation
6 OTHER TICKET ANALYSIS APPLICATIONS
6.1 Ticket Clustering
6.2 Ticket Classification
7 CONCLUSION