چکیده
سیستم IR وب فعلی اطلاعات مرتبط را فقط براساس کلمات کلیدی بازیابی می نماید، که این کار برای حجم وسیع داده ها، کافی نیست. سیستم مذکور قابلیت های محدودی برای کسب مفاهیم نیازهای کاربر و رابطه بین کلمات کلیدی فراهم می نماید. این محدودیت ها منجر به ایده جستجوی مفهومی کاربر می گردند که شامل مفاهیم و معانی می شود. این مطالعه با سیستم بازیابی اطلاعات معنایی برای جستجوی وب معنایی سرو کار داشته و یک الگوریتم بهبود یافته برای بازیابی کارآمدتر اطلاعات معرفی نمود.
این معماری از لیست کلمات کلیدی ساده ای که توسط کاربر فراهم گردید، به عنوان ورودی استفاده نموده و پرس و جو به پرس و جوی معنایی تبدیل می گردد. عملیات تبدیل با کمک مفاهیم حوزه آنتولوژیهای حوزه از قبل موجود و مجموعه اطلاعات (خزانه) شخص ثالث انجام شده و رابطه معنایی بین آنها در زمان اجرا، کشف می گردد. اطلاعات مرتبط برای پرس و جوی معنایی، بازیابی و طبق ربطشان با کمک یک الگوریتم بهبود یافته رتبه بندی می گردند. تحلیل عملکرد نشان می دهد که سیستم پیشنهادی در مقایسه با سیستم های موجود می تواند صحت و اثربخشی بازیابی اسناد وب مرتبط را بهبود بخشد.
1. مقدمه
1. 1 انگیزه
شبکه جهانی وب برای بسیاری از خدمات اطلاعاتی، به عنوان یک مرکز اطلاعات جهانی توزیع شده وسیع عظیم عمل می کند. حال، اندازه وب، از بیلیون ها وب سایت تشکیل شده و به سرعت رو به رشد است. اما کاربر عادی اغلب برای دستیابی به نیازمندی درست، زمان زیادی صرف می کند. برای ارائه نتایج مرتبط از این حجم وسیع داده ها برای کاربر، و فیلتر نمودن نتایج، باید به برخی روشهای جدید دست یافت. فناوری اطلاعات فعلی از وب، عمدتاً بر مبنای کلمات کلیدی است. او قابلیت های محدودی برای کسب مفهوم نیازمندی کاربر فراهم می نماید. برای حل محدودیت های جستجو بر مبنای کلمات کلیدی، ایده جستجوی معنایی در فیلد بازیابی اطلاعات (IR) معرفی شده است. بازیابی اطلاعات، به علم جستجوی اسناد، اطلاعات موجود درون اسناد و پایگاه داده رابطه ای و شبکه جهانی وب گفته می شود. IR، با نمایش، ذخیره، و سازماندهی محتوا نیز سرو کار دارد.
Abstract
The current web IR system retrieves relevant information only based on the keywords which is inadequate for that vast amount of data. It provides limited capabilities to capture the concepts of the user needs and the relation between the keywords. These limitations lead to the idea of the user conceptual search which includes concepts and meanings. This study deals with the Semantic Based Information Retrieval System for a semantic web search and presented with an improved algorithm to retrieve the information in a more efficient way.
This architecture takes as input a list of plain keywords provided by the user and the query is converted into semantic query. This conversion is carried out with the help of the domain concepts of the pre-existing domain ontologies and a third party thesaurus and discover semantic relationship between them in runtime. The relevant information for the semantic query is retrieved and ranked according to the relevancy with the help of an improved algorithm. The performance analysis shows that the proposed system can improve the accuracy and effectiveness for retrieving relevant web documents compared to the existing systems.
1. Introduction
1.1. Motivation
The World Wide Web serves as a huge wide distributed global information center for many information services. By now the size of the web is billions of websites and is still growing rapidly. But to get an exact requirement a normal user often spends a lot of time. In order to present the relevant results from this voluminous data to the user, some new methods should be derived to filter the results. The current information technology from the web is mostly based on the keywords. It provides limited capabilities to capture the concept of the user requirement. To solve the limitations of the keyword based search the idea of semantic search is introduced in the field of information retrieval (IR). Information retrieval is the science of searching for documents, information within the documents as well as that of relational database and the World Wide Web. IR also deals with representing, storing and organizing the content.
چکیده
مقدمه
انگیزه
کارهای تحقیق
ساختار مقاله
کارهای مرتبط
معماری SBIRS پیشنهادی
خزشگر
پیش پردازنده
سیستم حاشیه نویسی معنایی (حاشیه نویس)
سیستم شاخص گذاری معنایی (شاخص گذار)
تبدیل کننده پرس و جوی معنایی
سیستم بازیابی محتوای معنایی
سیستم رتبه بندی معنایی
الگوریتم ها
پیاده سازی و آزمایش
نتایج و جهت گیریهای آتی
جهت گیریهای آتی
Abstract
1. Introduction
1.1. Motivation
1.2. Research contributions
2. Related work
3. Proposed SBIRS architecture
3.1. Crawler
3.2. Pre-processor
3.3. Semantic annotator
3.4. Semantic indexer
3.5. Semantic query converter
3.6. Semantic content retriever
3.7. Semantic ranker
4. Algorithms
5. Implementation and experimentation
5.1. Conclusions and future directions
6. Future directions