چکیده
در این مطالعه مطالعه ای در مورد چگونگی استخراج اطلاعات مفید روی وب مطرح نموده و همچنین دانش سطحی و مقایسه در مورد داده کاوی را ارائه می دهیم. این مقاله حال، گذشته و آینده وب کاوی را شرح می دهد. در اینجا منابع آنلاین برای بازیابی اطلاعات روی وب را معرفی می کنیم، به عبارتی محتواکاوی وب، و کاوش الگوهای دسترسی کاربر از وب سرورها، به عبارتی کاربردکاوی وب که اشکال داده کاوی را بهبود می بخشد. به علاوه، وب کاوی را از طریق رایانش ابری، به عبارتی ابرکاوی نیز شرح دادیم. به آن می توان به عنوان ویژگی وب کاوی نگاه کرد.
1. مقدمه
پذیرش وسیع اینترنت اصولاً راههای ارتباطی ما، گردآوری اطلاعات، تجارت و خریدها را تغییر داده است. به عنوان کاربرد شبکه جهانی وب و افزایش ایمیل، دانشمندان کامپیوتر و فیزیکدانان شروع به توصیف این پدیده جدید نمودند. در حالیکه ابتداعاً از تنوع چشمگیر اینترنت در اندازه ویژگیهایش شگفت زده شدند، اما به زودی الگوی گسترده در اندازه گیریهای آنها را کشف کردند: عناصر کوچک زیادی در وب وجوددارد اما تعداد عناصر بزرگ کم است. تعداد معدودی از سایت ها از میلیون های صفحه تشکیل می شوند، اما میلیونها سایت تنها محتوی تعدادی صفحه می باشند. تعداد معدودی از سایت ها محتوی میلیون ها لینک می باشند، اما بسیاری از سایت ها دارای یک یا دو لینک می باشند. میلیون ها کاربران به تعداد معدودی سایت روی آورده و به میلیون ها سایت دیگر کمتر توجه می کنند.
Abstract
In this paper we presents study about how to extract the useful information on the web and also give the superficial knowledge and comparison about data mining. This paper describes the current, past and future of web mining. Here we introduce online resources for retrieval Information on the web i.e. web content mining, and the discovery of user access patterns from web servers, i.e. web usage mining that improve the data mining drawback. Furthermore, we also described web mining through cloud computing i.e. cloud mining. That can be seen as future of Web Mining. Keywords-Web Mining; Web Content Mining; Web Structure Mining; Web Usage Mining; Cloud Mining
I. INTRODUCTION
The wide adoption of the Internet has fundamentally altered the ways in which we communicate, gather information, conduct businesses and make purchases. As the use of the World Wide Web and email skyrocketed, computer scientists and physicists rushed to characterize this new phenomenon. While initially they were surprised by the tremendous variety the Internet demonstrated in the size of its features, they soon discovered a widespread pattern in their measurements: there are many small elements contained within the Web, but few large ones. A few sites consist of millions of pages, but millions of sites only contain a handful of pages. Few sites contain millions of links, but many sites have one or two. Millions of users flock to a few select sites, giving little attention to millions of others.
چکیده
1. مقدمه
A. تکامل تاریخی وب کاوی
B. اشکالات و موانع شیوه های موجود
2. وب کاوی
A. طبقات وب کاوی
B. وب کاوی در برابر داده کاوی
3. وب کاوی از طریق رایانش ابری
4. کارهای مرتبط
5. نتیجه گیری و کار آتی
Abstract
I. INTRODUCTION
A. Historical Evolution of Web Mining
B. Drawbacks in the existing approaches
II. WEB MINING
A. Web Mining Categories
B. Web Mining v/s Data Mining
III. WEB MINING THROUGH CLOUD COMPUTING
IV. RELATED WORK
V. CONCLUSION & FUTURE WORK