یادداشت سردبیر: این سرمقاله یک سری از نوشتههای ویراستاران را باهمکاری مدیر اجرایی، رهبر فکری و یا محقق ارشد دیگری از زمینههای مختلف برای کشف زمینههای جدید محتوا و چالشهای بزرگ باهدف گسترش گستره، جذابیت و ارتباط کار ارائهشده در مجله آکادمی مدیریت تهیه میکند. اصل این است که از یادداشتهای سرمقاله بهعنوان «تنظیمکنندههای مرحله» برای کار بیشتر استفاده کنید و زمینههای جدیدی را برای تحقیقات مدیریت بازکنید.
دادههای بزرگ در همهجا وجود دارند. در سالهای اخیر، تأکید بیشتری بر دادههای بزرگ، تجزیهوتحلیل کسبوکار و محیطهای زندگی و کار «هوشمند» وجود دارد. اگرچه این مکالمات عمدتاً بهکاررفتهاند، سازمانها در حال بررسی چگونگی استفاده از حجم گسترده دادهها برای ایجاد و ارزشگذاری برای افراد، کسبوکارها، جوامع و دولتها هستند (موسسه جهانی مک کینزی، 2011). اینکه آیا یادگیری ماشینی و تجزیهوتحلیل وب برای پیشبینی عمل فردی، انتخاب مصرفکننده، رفتار جستجو، الگوهای ترافیکی یا شیوع بیماری است، دادههای بزرگ بهسرعت به یک ابزار تبدیل میشود که نهتنها الگوها را تجزیهوتحلیل میکند، بلکه میتواند احتمال یک رویداد را پیشبینی کند.
سازمانها استفاده از حجمهای در حال افزایش دادهها را، اغلب در میزان ظرفیت ذخیرهسازی ترا یا پتا بایتی، برای پیشبینی بهتر و دقیقتر نتایج دنبال میکنند. بهعنوانمثال، پالس جهانی سازمان ملل متحد یک ابتکار است که از منابع جدید دادههای دیجیتال مانند تماسها یا پرداختهای تلفن همراه، با تجزیهوتحلیل دادهها در زمان واقعی و دادهکاوی بهمنظور کمک به تلاشهای توسعه و درک آسیبپذیریهای در حال ظهور در کشورهای درحالتوسعه استفاده میکند. اگرچه «دادههای بزرگ» در حال حاضر بهعنوان یک اصطلاح تجاری شایع شده، اما تحقیق مدیریت منتشرشده بسیار کم است که چالشهای استفاده از چنین ابزارهایی را به عهده میگیرد یا وعده و فرصتهایی را برای نظریهها و شیوههای جدیدی که دادههای بزرگ ممکن است باعث شود، موردبررسی قرار میدهد. در این سرمقاله، برخی از پایههای مفهومی و همچنین راههای ممکن برای تحقیق و کاربرد آینده در مدیریت و تحقیق سازمانی را بررسی میکنیم.
«اطلاعات بزرگ» چیست؟
دادههای بزرگ از افزایش تعداد منابع، ازجمله اینترنت، معاملات تلفن همراه، محتوای تولیدشده توسط کاربر و رسانههای اجتماعی و همچنین محتوای هدفمند تولیدشده از طریق شبکههای حسگر یا معاملات تجاری مانند درخواستهای فروش و معاملات خرید ایجاد میشود. علاوه بر این، علم ژنوم ها، مراقبتهای بهداشتی، مهندسی، مدیریت عملیات، اینترنت صنعتی و مالی همه به فراوانی دادههای بزرگ اضافه میشوند. این دادهها نیاز به استفاده از فنهای محاسباتی قدرتمند برای نمایش روندها و الگوها در میان و بین این مجموعه دادههای بسیار بزرگ اجتماعی و اقتصادی دارند. بینشهای جدید از این استخراج ارزش دادهها جمعآوری میشود که میتواند بهطور معناداری آمار رسمی، نظرسنجیها و منابع دادههای بایگانی را که عمدتاً ثابت باقی میمانند، کامل کند، با افزودن عمق و بینش از تجارب جمعی - و انجام این کار در زمان واقعی، درنتیجه اطلاعات و فاصله زمانی را کاهش میدهد.
شاید «بزرگی» دادههای بزرگ اسمی بیمسما است که همیشه توجه محققان را بهاندازه مجموعه داده جذب میکند. در میان شاغلان، بحثهای تازهای وجود دارد که «بزرگ» دیگر پارامتر تعریفی نیست، بلکه چگونگی «هوشمندی» آن است- یعنی بینشهایی که حجم دادهها بهطور منطقی میتوانند ارائه دهند. برای ما، پارامتر تعریفی دادههای بزرگ، خود ماهیت دقیق دادهها است، بنابراین تمرکز را از تعداد شرکتکنندگان به اطلاعاتی در مورد فرد منتقل میکنیم. بهعنوانمثال، یک شرکتکننده در یک مسابقه ماشین فرمول 1 بیست گیگابایت اطلاعات از 150 حسگر موجود در ماشین تولید میکند که میتواند به تجزیهوتحلیل عملکرد فنی اجزای آن و همچنین واکنش راننده، تأخیر در توقف دستانداز و ارتباط بین خدمه و راننده و درنهایت عملکرد کلی کمک کند (مونفورد، 2014)؛ بنابراین تأکید از نتایج (برنده شدن/ از دست دادن مسابقه) بهجای تمرکز بر هر مبدأ، بر عنصر مشارکتی برای موفقیت یا شکست در هر ثانیه از مسابقه تغییر میکند. بهطور مشابه میتوان شبکههای اجتماعی و رفتارهای تعامل اجتماعی افراد را با نقشهبرداری از الگوهای تحرک در طرحبندی فیزیکی فضاهای کاری با استفاده از حسگرها یا فرکانس حسگرهای از راه دور مورداستفاده از اتاق جلسه تجزیهوتحلیل کرد که الگوهای ورود و خروج را دنبال میکنند و میتواند اطلاعات را در ارتباطات و نیازهای هماهنگی بر اساس پیچیدگی پروژه و نزدیکی به مهلت ارائه کند. این دادههای کوچک، غنای رفتارها و اعمال فردی را فراهم میکند که هنوز در تحقیقات مدیریتی مورداستفاده قرار نگرفته است. اگر دادهها «بزرگ» یا «هوشمند» باشند، استفاده از دادههای بزرگ برای پیشبینی رفتار انسان، در عمل کسبوکار و سیاستهای دولت و همچنین در حوزههای علمی که علوم فیزیکی و اجتماعی همگرا هستند، اعتبار کسب میکند (بهتازگی به بهعنوان «فیزیک اجتماعی» نامبرده میشود) (پنتلند، 2014).
منابع دادههای بزرگ
دادههای بزرگ نیز یک بستهبندی برای انواع مختلف دادههای دانهای است. در زیر، ما پنج منبع کلیدی دادههای با حجم بالا را فهرست میکنیم: (1) دادههای عمومی، (2) دادههای خصوصی، (3) خروجی دادهها، (4) دادههای اجتماعی و (5) دادههای خودکفایی.
«دادههای عمومی» اطلاعاتی هستند که معمولاً توسط دولتها، سازمانهای دولتی و جوامع محلی نگهداری میشود که میتواند بهطور گستردهای برای برنامههای کاربردی گسترده تجارت و مدیریت تهیه شود. نمونههایی از این دادهها شامل موارد مربوط به حملونقل، مصرف انرژی و مراقبتهای بهداشتی است که تحت محدودیتهای خاصی بهمنظور محافظت از حریم شخصی افراد در دسترس هستند. «دادههای خصوصی» دادههایی هستند که توسط شرکتهای خصوصی، سازمانهای غیرانتفاعی و افرادی که اطلاعات خصوصی را منعکس میکنند و نمیتوانند بهراحتی از منابع عمومی محاسبه شوند، نگهداری میشود. برای مثال، دادههای خصوصی عبارتاند از معاملات مصرفکننده، برچسبهای شناسایی فرکانس رادیویی که توسط زنجیرههای عرضه سازمانی استفاده میشود، انتقال کالاها و منابع شرکت، مرور وبسایت و استفاده از تلفن همراه و چندین مورد دیگر.
«خروجی دادهها» به دادههای محیطی اشاره دارد که بهطور انحصاری جمعآوری میشوند، دادههای غیرهستهای باارزش محدود یا صفر به شریک جمعآوری داده اصلی. این دادهها برای اهداف متفاوت جمعآوریشدهاند، اما میتوانند با دیگر منابع دادهها دوباره ترکیب شوند تا منابع باارزش جدیدی ایجاد کنند. هنگامیکه افراد از فناوریهای جدید (بهعنوانمثال، تلفنهای همراه) استفاده میکنند، دادههای محیطی را بهعنوان محصولاتی از فعالیتهای روزمره آنها تولید میکنند. افراد ممکن است بهطور غیرمستقیم اطلاعاتی را در مورد زندگی روزمره خود (مثلاً زمانی که خرید میکنند، حتی در بازارهای غیررسمی، زمانی که به مراقبتهای بهداشتی اولیه دسترسی پیدا میکنند یا زمانی که با دیگران ارتباط برقرار میکنند) منتشر کنند. منبع دیگری از خروجی دادهها، رفتار جستجوگر اطلاعاتی است که میتواند برای ارزیابی نیازها، خواستهها یا قصدهای افراد استفاده شود که شامل جستجوهای اینترنتی، خطوط تلفن مستقیم یا سایر مراکز تماس خصوصی است.
«دادههای اجتماعی» تقطیر دادههای بدون ساختار- بهویژه متن- به شبکههای پویا است که روندهای اجتماعی را جذب میکنند. دادههای معمول جامعه شامل بررسی مصرفکنندگان در محصولات، دکمههای رأیگیری (مانند «به نظر من این بررسی مفید است») و توییتر و بسیاری موارد دیگر است. سپس دادههای مربوط به جامعه میتوانند به معنی برای کسب الگوها در ساختار اجتماعی تبدیل شوند (برای مثال، کندی، 2008). «دادههای خودارزیابی» انواع دادههایی هستند که توسط فرد از طریق تعیین فعالیتهای شخصی و رفتارها مشخص میشود. بهعنوانمثال، یکشکل مشترک از دادههای خود تخمینی توسط دستبندهایی به دست میآید که ورزش و حرکت را ثبت میکنند، دادههایی که پسازآن به یک برنامه تلفن همراه ارسال میشوند و سپس میتوانند ردیابی و جمع شوند. در روانشناسی، افراد «اولویتهای واقعی» ازآنچه را که میخواهند انجام دهند در مقابل «اولویتهای مجازی» دارند که در آن ترجیح یک عمل یا رفتار استنباط میشود. بهعنوانمثال، یک فرد ممکن است لامپهای کممصرف را باهدف صرفهجویی در مصرف برق خریداری کند، اما در عوض، چراغها را به مدت طولانیتری روشن نگه دارد، زیرا اکنون انرژی کمتری مصرف میکنند. این دادههای خودارزیابی، ارتباط بین روانشناسی و رفتار را تسهیل میکند. محققان علوم اجتماعی از نقاط مختلف، مانند روانشناسی، بازاریابی یا سیاست عمومی میتوانند از دادههای ترجیحی واقعی و ضمنی برای استفاده در تحقیقات خود بهرهمند شوند.
Editor’s note: This editorial launches a series written by editors and co-authored with a senior executive, thought leader, or scholar from a different field to explore new content areas and grand challenges with the goal of expanding the scope, interestingness, and relevance of the work presented in the Academy of Management Journal. The principle is to use the editorial notes as “stage setters” for further work and to open up fresh, new areas of inquiry for management research.
Big data is everywhere. In recent years, there has been an increasing emphasis on big data, business analytics, and “smart” living and work environments. Though these conversations are predominantly practice driven, organizations are exploring how large-volume data can usefully be deployed to create and capture value for individuals, businesses, communities, and governments (McKinsey Global Institute, 2011). Whether it is machine learning and web analytics to predict individual action, consumer choice, search behavior, traffic patterns, or disease outbreaks, big data is fast becoming a tool that not only analyzes patterns, but can also provide the predictive likelihood of an event.
Organizations have jumped on this bandwagon of using ever-increasing volumes of data, often in tera- or petabytes’ worth of storage capacity, to better predict outcomes with greater precision. For example, the United Nations’ Global Pulse is an initiative that uses new digital data sources, such as mobile calls or mobile payments, with real-time data analytics and data mining to assist in development efforts and understanding emerging vulnerabilities across developing countries. Though “big data” has now become commonplace as a business term, there is very little published management scholarship that tackles the challenges of using such tools— or, better yet, that explores the promise and opportunities for new theories and practices that big data might bring about. In this editorial, we explore some of its conceptual foundations as well as possible avenues for future research and application in management and organizational scholarship.
WHAT IS “BIG DATA”?
Big data is generated from an increasing plurality of sources, including Internet clicks, mobile transactions, user-generated content, and social media as well as purposefully generated content through sensor networks or business transactions such as sales queries and purchase transactions. In addition, genomics, health care, engineering, operations management, the industrial Internet, and finance all add to big data pervasiveness. These data require the use of powerful computational techniques to unveil trends and patterns within and between these extremely large socioeconomic datasets. New insights gleaned from such data-value extraction can meaningfully complement official statistics, surveys, and archival data sources that remain largely static, adding depth and insight from collective experiences—and doing so in real time, thereby narrowing both information and time gaps.
Perhaps the misnomer is in the “bigness” of big data, which invariably attracts researchers’ attention to the size of the dataset. Among practitioners, there is emergent discussion that “big” is no longer the defining parameter, but, rather, how “smart” it is—that is, the insights that the volume of data can reasonably provide. For us, the defining parameter of big data is the fine-grained nature of the data itself, thereby shifting the focus away from the number of participants to the granular information about the individual. For example, a participant in a Formula 1 car race generates 20 gigabytes of data from the 150 sensors on the car that can help analyze the technical performance of its components, but also the driver reactions, pit stop delays, and communication between crew and driver that contribute to overall performance (Munford, 2014). The emphasis thus moves away from outcomes (win/lose race), to instead focus on each proximal, contributory element for success or failure mapped for every second during the race. Similarly, one could analyze the social networks and social engagement behaviors of individuals by mapping mobility patterns onto physical layouts of workspaces using sensors, or the frequency of meeting room usage using remote sensors that track entry and exit patterns, which could provide information on communication and coordination needs based on project complexity and approaching deadlines. These micro data provide a richness of individual behaviors and actions that have not yet been fully tapped in management research. Whether it is “big” or “smart” data, the use of large-scale data to predict human behavior is gaining currency in business and government policy practice, as well as in scientific domains where the physical and social sciences converge (recently referred to as “social physics”) (Pentland, 2014).
Sources of Big Data
Big data is also a wrapper for different types of granular data. Below, we list five key sources of high volume data: (1) public data, (2) private data, (3) data exhaust, (4) community data, and (5) selfquantification data.
“Public data” are data typically held by governments, governmental organizations, and local communities that can potentially be harnessed for wide-ranging business and management applications. Examples of such data include those concerning transportation, energy use, and health care that are accessed under certain restrictions in order to guard individual privacy. “Private data” are data held by private firms, non-profit organizations, and individuals that reflect private information that cannot readily be imputed from public sources. For example, private data include consumer transactions, radio-frequency identification tags used by organizational supply chains, movement of company goods and resources, website browsing, and mobile phone usage, among several others.
“Data exhaust” refers to ambient data that are passively collected, non-core data with limited or zero value to the original data-collection partner. These data were collected for a different purpose, but can be recombined with other data sources to create new sources of value. When individuals adopt and use new technologies (e.g., mobile phones), they generate ambient data as by-products of their everyday activities. Individuals may also be passively emitting information as they go about their daily lives (e.g., when they make purchases, even at informal markets; when they access basic health care; or when they interact with others). Another source of data exhaust is information-seeking behavior, which can be used to infer people’s needs, desires, or intentions. This includes Internet searches, telephone hotlines, or other types of private call centers.
“Community data” is a distillation of unstructured data— especially text—into dynamic networks that capture social trends. Typical community data include consumer reviews on products, voting buttons (such as, “I find this review useful”), and Twitter feeds, among many others. These community data can then be distilled for meaning to infer patterns in social structure (e.g., Kennedy, 2008). “Self-quantification data” are types of data that are revealed by the individual through quantifying personal actions and behaviors. For example, a common form of self-quantification data is that obtained through the wristbands that monitor exercise and movement, data which are then uploaded to a mobile phone application and can then be tracked and aggregated. In psychology, individuals have “stated preferences” of what they would like to do versus “revealed preferences,” wherein the preference for an action or behavior is inferred. For example, an individual might buy energy-efficient lightbulbs with the goal of saving electricity, but, instead, keep the lights on longer because they are now using less energy. Such self-quantification data helps bridge the connection between psychology and behavior. Social science scholars from diverse areas, such as psychology, marketing, or public policy, could benefit from stated and implicit preference data for use in their research.
«اطلاعات بزرگ» چیست؟
منابع دادههای بزرگ
به اشتراکگذاری دادهها، حریم خصوصی و اخلاق
تجزیهوتحلیل دادههای بزرگ
دادههای بزرگ در تحقیقات مدیریت
منابع
WHAT IS “BIG DATA”?
Sources of Big Data
Data Sharing, Privacy, and Ethics
ANALYZING BIG DATA
BIG DATA IN MANAGEMENT RESEARCH
REFERENCES