چکیده
با توسعه تکنولوژیهای موقعیت یابی و افزایش محبوبیت دستگاههای آگاه از موقعیت، حجم های بزرگی از داده های خط سیر جمع آوری شده اند. به هر حال، مدیریت کارآمد و موثر و دسترسی به داده های خط سیر انبوه به عنوان یک چالش بزرگ باقی می ماند. پایگاه داده (دیتابیس) NoSQL نوظهور یک راهکار نویدبخش برای این چالش فراهم کرده است. اما اغلب پایگاه های داده NoSQL کنونی شاخص گذاری زمانی و مکانی مستقیم داده های خط سیر انبوه را پشتیبانی نمی کنند. این مقاله یک روش شاخص گذاری خط سیر نوین برای تسریع جستارهای (پرس و جوهای) زمانی و مکانی زمان بر داده های خط سیر انبوه ارائه می کند. این روش الگوریتم به طور گسترده مورد استفاده ژئوهش را جهت برآورده سازی الزامات برای هردوی آپدیت های بسیار مکرر و عملیاتهای پرس و جوی خط-سیر یعنی پرس و جوی نقطه ای دقیق و پرس و جوی برد (طیف) زمانی و مکانی بسط می دهد. این شاخص ST-Hash در پایگاه داده NoSQL (MongoDB) پیاده سازی شده و مورد ارزیابی قرار گرفته است. نتایج تجربی نشان می دهند که شاخص ST-Hash پیشنهادی می تواند به طور گسترده عملکرد پرس و جو (جستار) را بهبود ببخشد و مقیاس پذیری عملکرد نیرومند روی داده های ورودی با اندازه های مختلف نشان دهد.
1-مقدمه
در حال حاضر، اغلب دستگاههای موبایل دارای توانایی های موقعیت یابی و ارتباطات بیسیم هستند. آنها می توانند به طور پیوسته خطوط سیر دستگاه را ثبت کنند و به طور دینامیک موقعیت ها را به یک سرور دور افتاده گزارش کنند [1 و 2]. داده های خط سیر عمومی تاریخچه حرکتی اشیاء متحرک همانند اشخاص، وسایل نقلیه یا یک پرواز هستند. آنها دارای مشخصه های زمانی و مکانی معمول هستند. هر داده خط سیر به طور معمول حاوی مختصات دوبعدی/سه بعدی، یک مهر زمانی همراه با آن و یک توالی از خصوصیات و ویژگی ها همانند سرعت، جهت، شتاب، دما و غیره است. داده های خط سیر برای تجزیه و تحلیل پیچیده در میان قلمروهای مختلف از جمله پایش زیست محیطی [1]، مدیریت ترافیک [3]، تجزیه و تحلیل تصویر ماهواره ای [4] و امنیت داخلی مورد استفاده قرار گرفتند.
6- نتیجه گیری ها
مدیریت داده های خط سیر حجم بالا یک مسئولیت چالش برانگیز در زمینه های بسیاری می باشد. تکنولوژی پایگاه داده نوظهور NoSQL یک راهکار برای مدیریت متفاوت این حجم عظیم داده های خط سیر نوید می دهد اما اغلب پایگاههای داده NoSQL کنونی به طور مستقیم از روش شاخص گذاری روی داده های زمانی و مکانی پشتیبانی نمی کنند. برای پرداختن به این مسئله، این مقاله یک روش شاخص گذاری خط سیر نوین برای تسریع پردازش جستارهای زمانی و مکانی ارائه می کند. این روش الگوریتم ژئوهش به طور گسترده مورد استفاده را برای برآورده-سازی الزامات ارتقاء فرکانس بالا و عملیاتهای جستار (پرس و جوی) خط سیر معمول بسط می دهد. راهکار شاخص گذاری ST-Hash در MongoDB، پایگاه داده معمول NoSQL، پیاده سازی شده است. نتایج تجربی نشان می دهند که روش شاخص گذاری پیشنهادی می تواند به طور قابل توجه عملکرد پرس و جو را بهبود بخشد. به طور همزمان، این روش مقیاس پذیری نیرومند براساس اندازه های داده ورودی مختلف نشان می دهد. وقتی که اندازه داده های ورودی هدف از 10 گیگابایت به 80 گیگابایت افزایش می یابد، زمان پرس و جو پایدار باقی می ماند. کار آینده روی پشتیبانی پرس و بیشتر پیچیده تمرکز خواهد کرد و امکانپذیری روش ST-Hash را در سناریوهای بسیار پیچیده همانند کاوش الگو، شبیه سازی ترافیک و غیره ارزیابی خواهد کرد.
Abstract
With the development of positioning technologies and the increasing popularity of location-aware devices, large volumes of trajectory data have been accumulated. However, efficient management and access to massive trajectory data remains a big challenge. The emerging NoSQL database has provided a promising solution for this challenge. But most of the current NoSQL databases do not support direct spatiotemporal indexing of massive trajectory data. This paper presents a novel trajectory indexing method to accelerate time-consuming spatiotemporal queries of massive trajectory data. This method extends the widely-used GeoHash algorithm to satisfy the requirements for both high-frequent updates and common trajectory query operations, e.g. exact point query and spatiotemporal range query. This ST-Hash index was implemented and evaluated in a NoSQL database (MongoDB). Experimental results show that this proposed ST-Hash index can greatly improve the query performance and exhibits robust performance scalability over different input data sizes.
چکیده
1-مقدمه
2- کارهای مرتبط
3- روش شاخص گذاری ST-Hash
A-کد باینری یک نقطه خط سیر
B- رشته Base64 یک نقطه خط سیر
4- رابط پرس و جو برای شاخص ST-Hash
A-جستار نقطه زمانی و مکانی
B- جستار برد زمانی و مکانی
C- جستار دایره زمانی و مکانی
D- رابط جستار مبتنی بر وب سرویس
5- نتایج عملکرد و بحث
A-طرح ذخیره سازی داده های خط سیر در پایگاه داده MongoDB
B- مقایسه عملکرد براساس جستارهای برد زمانی و مکانی
C- مقایسه عملکرد براساس جستارهای دایره زمانی و مکانی
D- مقیاس پذیری روش شاخص گذاری ST-Hash
6- نتیجه گیری ها
Abstract
I. Introduction
II. Related Work
III. The Indexing Method of ST-Hash
IV. The Query Interface for the ST-Hash Index
V. Performance Results and Discussions
VI. Conclusions