ساختارهای داده ای I / O کارآمد برای نمایه سازی غیر همپوشانی
ترجمه نشده

ساختارهای داده ای I / O کارآمد برای نمایه سازی غیر همپوشانی

عنوان فارسی مقاله: ساختارهای داده ای I / O کارآمد برای نمایه سازی غیر همپوشانی
عنوان انگلیسی مقاله: I/O-efficient data structures for non-overlapping indexing
مجله/کنفرانس: علوم کامپیوتر نظری - Theoretical Computer Science
رشته های تحصیلی مرتبط: مهندسی کامپیوتر
گرایش های تحصیلی مرتبط: مهندسی نرم افزار، مهندسی الگوریتم ها و محاسبات
کلمات کلیدی فارسی: درخت پسوند، ساختار داده، الگوریتم های رشته
کلمات کلیدی انگلیسی: Suffix Trees - Data Structure - String Algorithms
نوع نگارش مقاله: مقاله پژوهشی (Research Article)
شناسه دیجیتال (DOI): https://doi.org/10.1016/j.tcs.2020.12.006
دانشگاه: Informatics Institute, Istanbul Technical University, Turkey
صفحات مقاله انگلیسی: 17
ناشر: الزویر - Elsevier
نوع ارائه مقاله: ژورنال
نوع مقاله: ISI
سال انتشار مقاله: 2021
ایمپکت فاکتور: 1.231 در سال 2020
شاخص H_index: 110 در سال 2021
شاخص SJR: 0.570 در سال 2020
شناسه ISSN: 0304-3975
شاخص Quartile (چارک): Q2 در سال 2020
فرمت مقاله انگلیسی: PDF
وضعیت ترجمه: ترجمه نشده است
قیمت مقاله انگلیسی: رایگان
آیا این مقاله بیس است: خیر
آیا این مقاله مدل مفهومی دارد: ندارد
آیا این مقاله پرسشنامه دارد: ندارد
آیا این مقاله متغیر دارد: ندارد
کد محصول: E15284
رفرنس: دارای رفرنس در داخل متن و انتهای مقاله
فهرست مطالب (ترجمه)

خلاصه

کلید واژه ها

1. مقدمه و کارهای مرتبط

2. مقدمات و ساختارهای اساسی

3. نمایه سازی غیر همپوشانی - حافظه پنهان به طور کامل فراموش می شود

4- محدوده نمایه سازی غیر همپوشانی در مدل آگاه از حافظه پنهان

اعلامیه منافع رقابتی

تصدیق

منابع

فهرست مطالب (انگلیسی)

Abstract

Keywords

1. Introduction and related work

2. Preliminaries and basic structures

3. Non-overlapping indexing - cache obliviously

4. Range non-overlapping indexing in cache-aware model

Declaration of Competing Interest

Acknowledgement

References

بخشی از مقاله (انگلیسی)

1. Introduction and Related Work

Text indexing is fundamental to many areas in Computer Science such as Information Retrieval, Bioinformatics, etc. The primary goal here is to preprocess a long text T[1, n] (given in advance), such that whenever a shorter pattern P[1, m] comes as query, all occ occurrences (or simply, starting positions) of P in T can be reported efficiently. Such queries can be answered in optimal O(m + occ) time using the classic Suffix tree data structure [1, 2]. It takes O(n) words of space. In this paper, we focus on a variation of the text indexing problem, known as the non-overlapping indexing, which is central to data compression [3, 4].

Problem 1 (Non-overlapping Indexing). Preprocess a text T[1, n] into a data structure that supports the following query: given a pattern P[1, m], report a largest set of occurrences of P in T (denote its size by nocc), such that any two (distinct) text positions in the output are separated by at least m characters.