دانلود مقاله بررسی پایگاه‌های داده قابل یادگیری ماشینی
ترجمه نشده

دانلود مقاله بررسی پایگاه‌های داده قابل یادگیری ماشینی

عنوان فارسی مقاله: بررسی پایگاه‌های داده قابل یادگیری: دیدگاه یادگیری ماشینی
عنوان انگلیسی مقاله: Survey on Learnable Databases: A Machine Learning Perspective
مجله/کنفرانس: تحقیقات کلان داده - Big Data Research
رشته های تحصیلی مرتبط: مهندسی کامپیوتر
گرایش های تحصیلی مرتبط: هوش مصنوعی _ نرم افزار
کلمات کلیدی فارسی: پایگاه های اطلاعاتی قابل یادگیری - بهینه سازی پایگاه داده - یادگیری ماشینی - AI4DB
کلمات کلیدی انگلیسی: Learnable databases - Database optimization - Machine learning - AI4DB
نوع نگارش مقاله: مقاله پژوهشی (Research Article)
شناسه دیجیتال (DOI): https://doi.org/10.1016/j.bdr.2021.100304
نویسندگان: Benyuan Zou - Jinguo You - Quankun Wang - Xinxian Wen - Lianyin Jia
دانشگاه: Faculty of Information Engineering and Automation, Kunming University of Science and Technology, China
صفحات مقاله انگلیسی: 13
ناشر: الزویر - Elsevier
نوع ارائه مقاله: ژورنال
نوع مقاله: ISI
سال انتشار مقاله: 2022
ایمپکت فاکتور: 3.692 در سال 2020
شاخص H_index: 29 در سال 2022
شاخص SJR: 0.994 در سال 2020
شناسه ISSN: 2214-5796
شاخص Quartile (چارک): Q1 در سال 2020
فرمت مقاله انگلیسی: PDF
وضعیت ترجمه: ترجمه نشده است
قیمت مقاله انگلیسی: رایگان
آیا این مقاله بیس است: بله
آیا این مقاله مدل مفهومی دارد: دارد
آیا این مقاله پرسشنامه دارد: ندارد
آیا این مقاله متغیر دارد: ندارد
آیا این مقاله فرضیه دارد: ندارد
کد محصول: e16344
رفرنس: دارای رفرنس در داخل متن و انتهای مقاله
نوع رفرنس دهی: vancouver
فهرست مطالب (ترجمه)

چکیده

مقدمه

پیکربندی پارامتر پایگاه داده ها

مدیریت ذخیره سازی پایگاه داده ها

بهینه سازی پرس و جو در پایگاه داده ها

رابط پرس و جو پایگاه داده ها

AI4DB در پایگاه های داده تجاری

معیار

امنیت پایگاه داده ها

نتیجه گیری و مطالعات آتی

منابع

فهرست مطالب (انگلیسی)

Abstract

Introduction

Database parameter configuration

Database storage management

Database query optimization

Database query interface

AI4DB in commercial databases

Benchmark

Database security

Conclusion and future work

References

بخشی از مقاله (ترجمه ماشینی)

چکیده

     در طول دهه‌های توسعه هوش مصنوعی، طیفی از برنامه‌های کاربردی شامل داده‌های تصویر، گفتار، متن و غیره با موفقیت توسط یادگیری ماشین طراحی شده‌اند. مزایا عمدتاً از توانایی یادگیری از داده ها ناشی می شود که اکثر پایگاه های داده سنتی فاقد آن هستند. سال‌های اخیر شاهد افزایش رویکردهایی بوده‌ایم که هوش مصنوعی را برای تقویت پایگاه‌های اطلاعاتی سنتی، یعنی پایگاه‌های اطلاعاتی قابل یادگیری، انطباق‌پذیرتر و هوشمندتر کردن پایگاه‌های داده را بررسی می‌کنند. به طور خاص، آنها را می توان به طور خودکار با توجه به آمار متریک تاریخی و حجم کاری پرس و جو فعلی بهینه سازی کرد، که به طور قابل توجهی عملکرد پایگاه داده را بهبود می بخشد و رنج تعمیر و نگهداری معمولی را کاهش می دهد. با این حال، یکی از مسائل مهم، به ویژه برای پزشکان، عدم توافق در تعاریف آنها و همچنین عدم طبقه بندی واضح از دیدگاه یادگیری ماشین است. برای کاهش این مشکلات، این مقاله مفاهیم و الگوریتم‌های مرتبط با پایگاه‌های اطلاعاتی قابل یادگیری را معرفی می‌کند و پیشرفت در پایگاه‌های اطلاعاتی قابل یادگیری را در پنج جنبه بررسی می‌کند: پیکربندی پارامتر پایگاه داده، مدیریت ذخیره‌سازی داده، بهینه‌سازی پرس و جو، رابط پرس و جو، و معیار پایگاه‌های اطلاعاتی قابل یادگیری. علاوه بر این، توسعه تکنیک های مبتنی بر هوش مصنوعی را در پایگاه های داده تجاری و رویکردهای جدید برای امنیت پایگاه داده مبتنی بر یادگیری بررسی می کنیم. ما یک چارچوب طبقه‌بندی از نظر ویژگی‌های ورودی، انتخاب مدل، و نتایج خروجی (که عمدتاً به عنوان برچسب‌های کلاس مشاهده می‌شوند) ایجاد می‌کنیم. در نهایت، کار فعلی را به پایان می‌رسانیم و کار آینده را روی پایگاه‌های اطلاعاتی قابل یادگیری مورد بحث قرار می‌دهیم.

توجه! این متن ترجمه ماشینی بوده و توسط مترجمین ای ترجمه، ترجمه نشده است.

بخشی از مقاله (انگلیسی)

Abstract

     During the decades of development of artificial intelligence, a spectrum of applications involving image, speech, text data, etc. are successfully powered by machine learning. The advantages are mainly derived from the learning ability from data, which most traditional databases lack. Recent years have seen a surge in approaches that explore artificial intelligence to power traditional databases, i.e. learnable databases, making databases more adaptive and intelligent. Specifically, they can be automatically optimized according to historical metric statistics and current query workload, which significantly improves the database performance and relieves the trivial routine maintenance suffering. However, one of the major issues, especially for practitioners, is the lack of consensus in their definitions as well as a lack of clear categorization from a machine learning perspective. To alleviate these problems, this paper introduces concepts and algorithms related to learnable databases and investigates the progress in learnable databases in five aspects: database parameter configuration, data storage management, query optimization, query interface, and benchmark of learnable databases. Additionally, we survey AI-empowered technique development in commercial databases and new approaches to learning-based database security. 

Introduction

     With the growth in popularity of machine learning and artificial intelligence, a spectrum of applications that involve speech recognition, image classification, and natural language processing, etc. are powered by machine learning and are witnessed their incredible success.

     Machine learning learns rules and patterns from data or experience. Usually, we train a model using data that is labeled or allow it to work on its own to discover information. As a branch of machine learning, reinforcement learning [1] recently attracts much attention. Reinforcement learning is a general framework of learning, forecasting and decision-making [2]. If a problem can be transformed into a sequential decision-making problem, which defines state, action and reward, then reinforcement learning may help to automate or optimize the strategy of manual design. With abundant data and increased computing power, deep learning mimics the workings of the human brain via building complex and deep networks.

Conclusion and future work

     This paper investigates the progress in learnable databases from the perspective of machine learning, including parameter configuration, storage management, query optimization, query interface, and benchmark test.

     The current main related work is summarized as follows. 1) self-tuning system parameter configuration based on historical workload and query data via reinforcement learning. 2) automatically data partitioning and index recommending or optimizing by using certain machine learning models. 3) self-optimizing query plan by estimating the query size and query cost via deep learning or reinforcement learning. 4) providing query interface by combining natural language and database SQL language. 5) many commercial databases have also introduced AI, and they have developed different new features. 6) database security generally refers to the security of the data and system operation.