چکیده
محل ذخیره داده مقدار زیادی از داده های متراکم و سوابق آن ها می باشد. آن ها معمولا توسط سیستم های فضایی OLAP (SOLAP) به منظور استخراج اطلاعات مرتبط مورد استفاده قرار می گیرند. استخراج چنین داده هایی ممکن است پیچیده و مشکل باشد. کاربر ممکن است بخشی از محل ذخیره داده که شامل اطلاعات مرتبط و چگونگی جستجوی بعدی است را نادیده بگیرد. از طرف دیگر، هدف سیستم های پیشنهادی کمک به کاربران به منظور بازیابی اطلاعات مرتبط براساس تنظیمات و اهداف تحلیلی شان است. از این رو، توسعه یک سیستم پیشنهادی SOLAP بهره برداری از محل ذخیره داده فضایی را بهبود می بخشد. این مقاله یک رویکرد SOLAP پیشنهادی ارائه می دهد که هدف آن کمک به کاربران برای بهره برداری بهتر از محل ذخیره داده فضایی و بازیابی اطلاعات توسط پیشنهاد جستجوی MDX (عبارات چندبعدی) فضایی شخصی سازی شده است. این رویکرد با استفاده از یک معیار مشابهت معنایی به سادگی تنظیمات و نیازهای کاربران SOLAP را تشخیص می دهد. این رویکرد بصورت نظری شرح داده می شود و توسط آزمایشاتی تایید می شود.
پیش زمینه
محل ذخیره داده (DW) به عنوان عنصری کارآمد در سیستم پشتیبانی در نظر گرفته می شود [7]. ساختار آن ها معمولا ساختاری چندبعدی می باشد (به نام مکعبی نیز خوانده می شود)، که مسیریابی سریع در سطوح مختلف داده های گسسته را آسان تر می کند (از سطوح بدتر به بهتر و برعکس). محل ذخیره داده فضایی (SDW) مقدار زیادی از داده های تاریخی که مشخصات مشابهی مانند توپولوژی و جهت دارند را ذخیره می کند. SDW می تواند توسط سیستم های SOLAP (پردازش تحلیلی فضایی آنلاین) مورد کاوش قرار گیرد تا تحلیل فضایی آنلاین را امکان پذیر سازد. سیستم های SOLAP تکنولوژی های GIS و OLAP (پردازش تحلیلی آنلاین) را ترکیب می کنند. آن ها توسط اجازه دادن به کاربران برای تصویرسازی و مسیریابی از طریق داده های فضایی متراکم و براساس مجموعه از ابعاد با سطوح مختلف گسستگی، فرصت هایی در زمینه تحلیل داده های محلی را به آن ها پیشنهاد دادند. کاربران SOLAP می توانند توسط آغاز یک توالی جستجوی MDX (عبارات چند بعدی) از ذخیره داده فضایی بهره برداری نمایند.
نتیجه گیری
در این مقاله، شخصی سازی سیستم های SOLAP از طریق روش پیشنهادی ارائه شده است. روش ارائه شده به کاربر در استفاده از محل ذخیره داده فضایی از طریق پیشنهاد پرسشنامه MDX شخصی سازی شده کمک می کند. روش (1) اولویت ها و اهداف تحلیل کاربر را با استفاده از تکنیک فیلتر مشترک تشخیص می دهد و (2) معیار مشابهت معنایی- فضایی بین پرسشنامه های MDX برای مقایسه اهداف تحلیلی کاربران و اولویت هایشان اعمال می شود. جزئیات چارچوب نظری این روش دارای مراحل مختلفی از جمله (1) فیلترینگ فایل ورودی (2) تولید پرسشنامه های منتخب (3) رتبه بندی پیشنهادها و (4) ارائه پیشنهادات می باشد. هر مرحله توسط الگوریتم های دقیق، چگونگی اجرای این مراحل را توضیح می دهد.
Abstract
Spatial data warehouses store a large amount of historized and aggregated data. They are usually exploited by Spatial OLAP (SOLAP) systems to extract relevant information. Extracting such information may be complex and difficult. The user might ignore what part of the warehouse contains the relevant information and what the next query should be. On the other hand, recommendation systems aim to help users to retrieve relevant information according to their preferences and analytical objectives. Hence, developing a SOLAP recommendation system would enhance spatial data warehouses exploitation. This paper proposes a SOLAP recommendation approach that aims to help users better exploit spatial data warehouses and retrieve relevant information by recommending personalized spatial MDX (Multidimensional Expressions) queries. The approach detects implicitly the preferences and needs of SOLAP users using a spatiosemantic similarity measure. The approach is described theoretically and validated by experiments.
Background
Data warehouses (DW) are being considered as efficient components of decision support systems [7]. They are usually structured according to the multidimensional structure (also called a cube), which facilitates a rapid navigation within different levels of data granularity (from coarser to finer level and vice versa). Spatial Data warehouses (SDW) store a large amount of historized spatial data which have specific characteristics such as topology and direction. SDW can be explored by SOLAP systems (Spatial OnLine Analytical Processing) to enable spatial online analysis. SOLAP systems combine both GIS and OLAP (On-Line Analytical Processing) technologies. They offer, to users, opportunities for spatial analysis of geo-localized data by allowing them to visualize and navigate through aggregated spatial data according to a set of dimensions with different levels of granularity. SOLAP users can exploit spatial data warehouses by launching a sequence of MDX (Multidimensional Expressions) queries.
Conclusion
In this paper, we propose a personalization of SOLAP systems through a recommendation approach. The approach assists the user in spatial data warehouse exploitation through the recommendation of personalized MDX queries. The approach (1) detects the preferences and the analysis objectives of the user using a collaborative filtering technique, and (2) applies a spatio-semantic similarity measure between MDX queries to compare the analytical objectives of the users and their preferences. We presented a theoretical framework detailing the various phases of the approach namely (1) log file filtering, (2) generation of candidate queries (3) ranking recommendations, and (4) presentation of recommendations. Each step is explained by detailed algorithms presenting how these phases can be implemented.
چکیده
پیش زمینه
رویکرد پیشنهادی: تکنولوژی جدید
معیارهای مشابهت معنایی فضایی بین پرسشنامه های MDX
تعاریف رسمی اولیه
مکعب (محل ذخیره داده فضایی چند بعدی)، طرح و ابعاد:
مراجع پرسشنامه
معیار مشابهت در مقایسه پرسشنامه های MDX
مثال های انگیزشی
پیشنهادات شخصی سازی شده پرسشنامه SOLAP: چارچوب مفهومی
فیلترینگ ورودی فایل
تولید پرسشنامه های منتخب
تولید پرسشنامه های منتخب با استفاده از محدوده شباهت
تولید k پرسشنامه برتر مشابه
رتبه بندی پرسشنامه های منتخب
ارائه پیشنهاد های نهایی
ارزیابی آزمایش
ارزیابی معیار شباهت
سیستم RECQUERY
تحلیل عملکرد
دقت ارزیابی
روش ارزیابی
دقت ارزیابی برای محدوده های مختلف شباهت
دقت ارزیابی برای مقادیر مختلف k
تعداد بهینه پیشنهادات نهایی
نتیجه گیری
Abstract
Background
Recommendation approach: state of the art
A spatio semantic similarity measure between MDX queries
Basic formal definitions
Cube (multidimensional spatial data warehouse), schema and dimensions
Query references
Similarity measure for comparing MDX queries
Motivating example
Personalized recommendations of SOLAP queries: conceptual framework
Log file filtering
Generation of candidate queries
Candidate queries generation using the threshold similarity
Generation of top k similar queries
Ranking of candidate queries
Proposal of final recommendations
Experimental evaluation
Similarity measure evaluation
RECQUERY system
Performance analysis
Precision evaluation
Evaluation technique
Precision evaluation for different similarity thresholds
Precision evaluation for different values of k
Optimal number of final recommendations
Conclusion