چکیده
امروزه شبکه های تحویل محتوا (CDNs)، بخش مهمی از زیر ساخت WEB پیشرفته شده اند. در این مقاله، عملکرد ارائه دهنده محتوای Akamai بررسی می شود. به این صورت که عملکرد پلتفرم موجود Akamai سنجیده شده و از دیدگاه طراحان CDN و مشتریان احتمالی، سوالی کلیدی و ساختاری مطرح می شود به این صورت که آیا پلتفرم های منطبق با Akamai که سعی در گسترش سرور ها در مکان های مختلف اینترنت دارند، از مزایای عملکرد اصلی روی مرکز داده ای یکپارچه تر که توسط سایر CDNs های قدرتمند نظیر Limelight پشتیبانی می شوند برخودار هستند یا خیر؟ اعتقاد ما بر این اساس است که روشی که در این مقاله شرح داده ایم، برای محققین عرصه CDN مفید خواهد بود.
1. مقدمه
پس از دوره ای زمانی که از ادغام صنعت گذشت، علاقه به شبکه های تحویل محتوا احیا شده است. ده ها شرکت CDN جدید ظهور کرده و تبدیل به بخش مهمی از زیر ساخت WEB شده اند: تنها Akamai ادعا می کند که 20 درصد از ترافیک کل WEB را ارائه می دهد. [3]
دو نکته اصلی فروش یک سرویس CDN موارد زیر هستند: بر اساس ظرفیت تقاضا، سرویس در اختیار تولید کنندگان محتوا قرار دهند. 2- از نقطه نظر کاربر، عملکرد دسترسی به محتوا را بهبود بخشند، زیرا محتوا را از مکان های مختلف تحویل می دهند. این مقاله بر روی نظریه دوم تمرکز دارد و عملکرد پلتفرم Akamai که در حال حاضر استفاده می شود را در نظر می گیرد و این سوال را پاسخ می دهد که چرا توسعه زیاد یک پلتفرم CDN بایستی وجود داشته باشد تا مزایای در دسترس بودن را برای کاربران ایجاد نماید.
مطالعه ما در مورد توزیع پلتفرم با بحث بر روی 2 روش اصلی در طراحی CDN که طی سالها با هم ادغام شده اند به هدف رسیده است. یک رویکرد که به طور نمونه توسط Akamai و Digital Island ارائه شده (در حال حاضر متعلق به سطح 3 ارتباطات)، ایجاد نقاط با ظرفیت نسبتا محدود را در نظر می گیرد که در صورت امکان، برای بسیاری از مکان ها در دسترس باشد. به عنوان مثال، پلتفرم Akamai در سال 2007 بیش از 3000 مکان در بیش از 750 شهر در بیش از 70 کشور را ارزیابی کرد که هر مکان کمتر از 10 سرور در اختیار داشت و ردپای آنها بیشتر از پیش رشد داشته است (http://www.akamai.com/hdwp را مشاهده کنید). رویکرد دیگر، مراکز داده بزرگ حاوی هزاران سرور ولی در مکان های کمتر را در نظر می گیرد. نمونه هایی از ارائه دهندگان با این رویکرد، Limelight و AT&T هستند. در حال حاضر Limelight 20 مرکز داده را در وب سایت خود لیست کرده است.[13]
عملاً ممکن است دلایل پیچیده ای وجود داشته باشد که در انتخاب این طراحی نقش دارند. از یک طرف Akamai تلاش می کند تا به منظور کاهش ترافیک بالا، سرورهای Cache خود را در برخی ISP ها به صورت رایگان قرار دهد، بنابراین هزینه اجرای پلتفرم خود را کاهش می دهد. از سوی دیگر، کنترل پلتفرم های متصل شده توسط Limelight و AT&T می تواند بهتر باشد و اغلب به جای مراکز داده ای که همراه CDN اجاره داده می شود، در مراکز داده ای که مالک آن هستند توسعه پیدا کنند. در عین حال، تعداد زیادی مکان ها اغلب به عنوان ترجمه مستقیم ذکر شده اند تا در دسترس بودن کلاینت و عملکرد تحویل محتوا بهبود یابد. بنابراین بدون اینکه در ارتباط با شایستگی این دو رویکرد قضاوتی داشته باشیم، بر روی رویکرد تجاری آنها تمرکز کرده و به این سوال پاسخ می دهیم: چه تعداد مکان از بعد اینکه عملکرد کلاینت مفید باشد کافی است؟ یا به صورت متفاوت مطرح می کنیم: چه زمانی با افزایش تعداد مکانها، برخورد کاهش پیدا می کند و بهبود دسترسی کلاینت حاصل می گردد. در حقیقت با توجه به مفاهیم عملکرد تقویت پلتفرم، مطالعه ما سیمای مهمی از دو رویکرد را نشان می دهد، و در نتیجه به بحث در مورد نقاط قوت آنها پرداخته خواهد شد.
توجه کنید که تعداد مکان ها نسبت مستقیم به کل ظرفیت CDN و همچنین توانایی CDN برای ارائه ظرفیت بر اساس تقاضای صورت گرفته از سمت ارائه دهندگان محتوا دارد. با فراهم کردن اتصالات کافی شبکه، منبع تغذیه و سرورها در یک مرکز داده مشخص، می توان ظرفیت CDN را در تعدادی مرکز داده نسبتاً کوچک متراکم نمود. به طور مثال جمله برگرفته شده از وب سایت Limelight را در نظر بگیرید: " هر Network Delivery Center مربوط به Limelight چایگاه هزاران سرور است" [13]که می تواند اشاره به این باشد که Limelight حداقل 20 هزار سرور در کل 20 مرکز داده اش باید در اختیار داشته باشد که حداقل 3 مرتبه بدتر از Akamai است، با وجود اینکه 2 مرتبه از نظر مکانی کوچک تر از Akamai است. از نظر ظرفیت شبکه، Limelight در ماه اوت سال 2009، دارای پهنای باند 2.5 ترابایت بود[12]، با این وجود ما نمی توانیم مقداری مشابه برای Akamai پیدا کنیم، این مقدار بیشتر از مجموع حد نصاب ترافیکی است که آن را تحویل داده است.[2]
فرضیه ای که مطرح می شود این است که شبکه های تحویل محتوا مدت ها پیش این تحقیقات را انجام داده اند. این امکان وجود دارد، ما هرگز نمی دانیم. به هر حال، تحقیقات اختصاصی و بررسی عمومی در اختیار عموم قرار نداشته و غالباً در راستای منافع صورت می گیرند. این مقاله تلاش دارد با بررسی عملکرد Akamai به این پرسش پاسخ دهد. به این دلیل Akamai را انتخاب کردیم که هم از لحاظ سهم بازار و هم از لحاظ وسعت، ارائه دهنده برتر CDN است. رویکرد عمومی ما این است که بررسی کنیم هنگامی که از چند مرکز داده عملیات انجام می گیرد، عملکرد تحویل محتوای پرسرعت Akamai به چه دلیلی می تواند آزاد دهنده باشد. توجه کنید که مفهوم عملکرد تقویت مرکز داده به وسیله CDN مشابه، اهمیت به سزایی دارد، زیرا احتمال این را برطرف می کند که نسخه های نامربوط در CDN های مختلف بتوانند بر روی نتایج تاثیر بگذارند. خلاصه ای از نتایج مقدماتی آشکار شده اند[24]. این مقاله، بررسی کامل را ارائه می دهد.
فعالیت ما، دیدگاه ها را در ارتباط با موارد زیر که مربوط شبکه های تحویل محتوا سهیم می کند:
• بهبود عملکرد CDN: CDN ها ظرفیت را بر اساس تقاضا ارائه می دهند، و از این رو برای اشتراک ارائه دهندگان محتوا از اضافه بار پیشگیری می کنند. ولی آیا CDN ها تجربه کاربر در خلال بارگیری معمولی را بهبود می بخشند؟ کریشنامورتی و همکارانش عملکرد CDN های مختلف را مقایسه کرده اند[11] ولی از نظر ما مطالعه ای که انجام داده ایم اولین مطالعه ای است که ارزیابی مستقیم و مستقلی از بهبود عملکرد دانلود های Akamai ارائه می دهد. علاوه بر این، ما هردو مورد بهبود عملکرد پیشنهاد شده توسط Akamai به ارائه دهندگان محتوا و همچنین کیفیت سرور Akamai انتخاب شده در هنگامی که یک cache را برای دانلود انتخاب می کند را در نظر می گیریم.
• میزان تولید پلتفرم. سوالی را درنظر می گیریم، تا چه اندازه مقادیر زیادی از نقاط حضور عملکرد CDN را بهبود می بخشد. در نظر گرفتن تنها یک جنبه از این موضوعات (عملکرد)، به ما کمک می کند و نیاز نیست در مورد بهتر بودن رویکردهای بیشتر توزیع شده در مقابل روش های تلفیقی برای طراحی CDN از دیدگاه مشتری بحثی را صورت بدهیم.
علاوه بر مشاهدات عملکرد فوق، امیدواریم که روشی که برای بدست آوردن آنها به آن می پردازیم برای پژوهش عملیاتی دیگران مفید باشد.
2. فعالیت مرتبط
امروزه تعدادی از CDN ها سرویس های پر سرعت ارائه می دهند[19,1,13,8,17]. مطالعه در این مورد می تواند مفید باشد زیرا در مورد اولویت های سرمایه گذاری زیر ساخت CDN ها و همچنین برای کمک به مشتریان در انتخاب یک ارائه دهنده CDN، تصمیم گیری خواهد شد.
ABSTRACT
Content delivery networks (CDNs) have become a crucial part of the modern Web infrastructure. This paper studies the performance of the leading content delivery provider – Akamai. It measures the performance of the current Akamai platform and considers a key architectural question faced by both CDN designers and their prospective customers: whether the co-location approach to CDN platforms adopted by Akamai, which tries to deploy servers in numerous Internet locations, brings inherent performance benefits over a more consolidated data center approach pursued by other influential CDNs such as Limelight. We believe the methodology we developed for this study will be useful for other researchers in the CDN arena.
1. INTRODUCTION
After a period of industry consolidation, there is a resurgence of interest in content delivery networks. Dozens new CDN companies have emerged and become a critical part of the Web infrastructure: Akamai alone claims to be delivering 20% of all Web traffic [3].
Two main “selling points” of a CDN service are (a) that they supply on-demand capacity to content providers and (b) that they improve performance of accessing the content from user perspective because they deliver the content from a nearby location. This paper focuses on the second aspect, and considers the performance of the current Akamai platform and the question of how widely dispersed a CDN platform needs to be to provide proximity benefits to the users.
Our study of platform distribution is motivated by the ongoing active discussion on the two main approaches in CDN design that have emerged over the years. One approach, exemplified by Akamai and Digital Island (currently owned by Level 3 Communications), aims at creating relatively limited-capacity points of presence at as many locations as possible. For example, Akamai platform in 2007 spanned more than 3,000 locations in over 750 cities in over 70 countries, with each location having on average less than ten servers, and their footprint has grown further since then (see http://www.akamai.com/hdwp p.2). The other approach utilizes massive data centers, comprising thousands of servers, but in many fewer locations. The examples of providers pursuing this approach include Limelight and AT&T. Limelight currently lists 20 data centers on its web site [13].
In practice, there may be complex reasons contributing to this design choice. On one hand, Akamai attempts to obtain free deployment of its cache servers at some ISPs in return for reducing the ISPs’ upstream traffic thus reducing the cost of running its platform. On the other hand, consolidated platforms pursued by Limelight and AT&T can be more manageable and often are deployed in data centers owned rather than rented by the CDN. Yet a large number of locations is often cited as directly translating to improved client proximity and content delivery performance. Thus, without passing judgment on the overall merits of the two approaches, we focus on this marketing claim and address the question: how many locations is enough from the client-observed performance perspective? Or, said differently, when does one hit the diminishing return in terms of improving client proximity by increasing the number of locations? In fact, by considering performance implications of platform consolidation, our study addresses an important aspect of the two approaches and thus contributes to the debate regarding their overall strengths.
Note that the number of locations is orthogonal to the overall CDN capacity and hence to the CDN’s ability to provide capacity-on-demand to content providers. By provisioning enough network connectivity, power supply, and servers at a given data center, one can assemble a very large aggregate CDN capacity at relatively small number of data centers. For example, from the statement on Limelight’s website that “Each Limelight Networks Delivery Center houses thousands of servers”[13] one can infer that Limelight has at least 20,000 servers across their 20 data centers, which is at worst three times as few as Akamai, despite having two orders of magnitude fewer locations. In terms of network capacity, Limelight had 2.5Tbps aggregate bandwidth in August 2009 [12]; while we could not find a similar number for Akamai, this is more than the aggregate peak traffic it has delivered [2].
One would assume that content delivery networks would have done this study themselves long time ago. This might be true - we will never know. However, proprietary research is not open to public (and public scrutiny) and is often driven by vested interests. This paper attempts to answer the above question by examining Akamai performance. We chose Akamai because it is the dominant CDN provider, both in terms of the market share and size. Our general approach is to study how performance of Akamai-accelerated content delivery would suffer if it were done from fewer data centers. Considering performance implications of data center consolidation by the same CDN is important because it eliminates a possibility that unrelated issues in different CDNs could affect the results. An abstract of our preliminary results appeared in [24]. The current paper present the complete study.
Our work contributes insights into the following aspects of content delivery networks:
• CDN performance improvement. CDNs offer capacity on-demand, and hence overload protection, to subscribing content providers. But do CDNs improve user experience during normal load? Krishnamurthy et al. [11] compared the performance of different CDNs, but to our knowledge ours is the first study that provides an independent direct estimate of the performance improvement of Akamai-accelerated downloads. In particular, we consider both performance improvement Akamai offers to content providers and the quality of Akamai server selection when it selects a cache for a download.
• The extent of platform distribution. We address a question to what extent a large number of points of presence improves CDN performance. While considering just one aspect – performance – of this issue, this contributes to the debate on the merits of the highly distributed vs. more consolidated approaches to CDN design from the customer perspective.
In addition to the above performance insights, we hope the methodology we develop to obtain them will be useful for others conducting research in this area.
2. RELATED WORK
A number of CDNs offer acceleration services today [19, 1, 13, 8, 17]. Our study could be useful for them as they decide on their infrastructure investment priorities and for their customers in selecting a CDN provider.
چکیده
1. مقدمه
2. فعالیت مرتبط
3. سابقه: شبکه های تحویل محتوا
4. روش شناسی
4.1 کشف edge server
4.2 لغو انتخاب CDN Edge Server
4.3 کنترل Edge Server Caching
4.4 ارزیابی Caching Bias سمت کلاینت
4.5 محاسبه عملکرد Edge Server
5. عملکرد AKAMAI CDN
5.1 آیا یک CDN عملکرد را بالا می برد؟
5.2 به چه دلیل انتخاب یک سرور Akamai مناسب است؟
6. عملکرد Akamai CDN تلفیقی
6.1 تلفیق مرکز داده
6.2 آزمایش DipZoom
6.3 یک مطالعه زنده
7. نتیجه
منابع
ABSTRACT
1. INTRODUCTION
2. RELATED WORK
3. BACKGROUND: CONTENT DELIVERY NETWORKS
4. METHODOLOGY
4.1 Edge Server Discovery
4.2 Overriding CDN Edge Server Selection
4.3 Controlling Edge Server Caching
4.4 Assessing Client-Side Caching Bias
4.5 Measuring Edge Server Performance
5. PERFORMANCE OF AKAMAI CDN
5.1 Does a CDN Enhance Performance?
5.2 How Good Is Akamai Server Selection?
6. PERFORMANCE OF CONSOLIDATED AKAMAI CDN
6.1 Data Center Consolidation
6.2 DipZoom Experiment
6.3 A Live Study
7. CONCLUSION
REFERENCES