چکیده
مقدمه
پیکربندی پارامتر پایگاه داده ها
مدیریت ذخیره سازی پایگاه داده ها
بهینه سازی پرس و جو در پایگاه داده ها
رابط پرس و جو پایگاه داده ها
AI4DB در پایگاه های داده تجاری
معیار
امنیت پایگاه داده ها
نتیجه گیری و مطالعات آتی
منابع
Abstract
Introduction
Database parameter configuration
Database storage management
Database query optimization
Database query interface
AI4DB in commercial databases
Benchmark
Database security
Conclusion and future work
References
چکیده
در طول دهههای توسعه هوش مصنوعی، طیفی از برنامههای کاربردی شامل دادههای تصویر، گفتار، متن و غیره با موفقیت توسط یادگیری ماشین طراحی شدهاند. مزایا عمدتاً از توانایی یادگیری از داده ها ناشی می شود که اکثر پایگاه های داده سنتی فاقد آن هستند. سالهای اخیر شاهد افزایش رویکردهایی بودهایم که هوش مصنوعی را برای تقویت پایگاههای اطلاعاتی سنتی، یعنی پایگاههای اطلاعاتی قابل یادگیری، انطباقپذیرتر و هوشمندتر کردن پایگاههای داده را بررسی میکنند. به طور خاص، آنها را می توان به طور خودکار با توجه به آمار متریک تاریخی و حجم کاری پرس و جو فعلی بهینه سازی کرد، که به طور قابل توجهی عملکرد پایگاه داده را بهبود می بخشد و رنج تعمیر و نگهداری معمولی را کاهش می دهد. با این حال، یکی از مسائل مهم، به ویژه برای پزشکان، عدم توافق در تعاریف آنها و همچنین عدم طبقه بندی واضح از دیدگاه یادگیری ماشین است. برای کاهش این مشکلات، این مقاله مفاهیم و الگوریتمهای مرتبط با پایگاههای اطلاعاتی قابل یادگیری را معرفی میکند و پیشرفت در پایگاههای اطلاعاتی قابل یادگیری را در پنج جنبه بررسی میکند: پیکربندی پارامتر پایگاه داده، مدیریت ذخیرهسازی داده، بهینهسازی پرس و جو، رابط پرس و جو، و معیار پایگاههای اطلاعاتی قابل یادگیری. علاوه بر این، توسعه تکنیک های مبتنی بر هوش مصنوعی را در پایگاه های داده تجاری و رویکردهای جدید برای امنیت پایگاه داده مبتنی بر یادگیری بررسی می کنیم. ما یک چارچوب طبقهبندی از نظر ویژگیهای ورودی، انتخاب مدل، و نتایج خروجی (که عمدتاً به عنوان برچسبهای کلاس مشاهده میشوند) ایجاد میکنیم. در نهایت، کار فعلی را به پایان میرسانیم و کار آینده را روی پایگاههای اطلاعاتی قابل یادگیری مورد بحث قرار میدهیم.
توجه! این متن ترجمه ماشینی بوده و توسط مترجمین ای ترجمه، ترجمه نشده است.
Abstract
During the decades of development of artificial intelligence, a spectrum of applications involving image, speech, text data, etc. are successfully powered by machine learning. The advantages are mainly derived from the learning ability from data, which most traditional databases lack. Recent years have seen a surge in approaches that explore artificial intelligence to power traditional databases, i.e. learnable databases, making databases more adaptive and intelligent. Specifically, they can be automatically optimized according to historical metric statistics and current query workload, which significantly improves the database performance and relieves the trivial routine maintenance suffering. However, one of the major issues, especially for practitioners, is the lack of consensus in their definitions as well as a lack of clear categorization from a machine learning perspective. To alleviate these problems, this paper introduces concepts and algorithms related to learnable databases and investigates the progress in learnable databases in five aspects: database parameter configuration, data storage management, query optimization, query interface, and benchmark of learnable databases. Additionally, we survey AI-empowered technique development in commercial databases and new approaches to learning-based database security.
Introduction
With the growth in popularity of machine learning and artificial intelligence, a spectrum of applications that involve speech recognition, image classification, and natural language processing, etc. are powered by machine learning and are witnessed their incredible success.
Machine learning learns rules and patterns from data or experience. Usually, we train a model using data that is labeled or allow it to work on its own to discover information. As a branch of machine learning, reinforcement learning [1] recently attracts much attention. Reinforcement learning is a general framework of learning, forecasting and decision-making [2]. If a problem can be transformed into a sequential decision-making problem, which defines state, action and reward, then reinforcement learning may help to automate or optimize the strategy of manual design. With abundant data and increased computing power, deep learning mimics the workings of the human brain via building complex and deep networks.
Conclusion and future work
This paper investigates the progress in learnable databases from the perspective of machine learning, including parameter configuration, storage management, query optimization, query interface, and benchmark test.
The current main related work is summarized as follows. 1) self-tuning system parameter configuration based on historical workload and query data via reinforcement learning. 2) automatically data partitioning and index recommending or optimizing by using certain machine learning models. 3) self-optimizing query plan by estimating the query size and query cost via deep learning or reinforcement learning. 4) providing query interface by combining natural language and database SQL language. 5) many commercial databases have also introduced AI, and they have developed different new features. 6) database security generally refers to the security of the data and system operation.