چکیده
مقدمه
اصول طراحی برای تجزیه و تحلیل داده ها
نتایج
بحث
منابع
Abstract
Introduction
Design principles for data analysis
Results
Discussion
References
چکیده
انقلاب داده ها منجر به افزایش علاقه به تحلیل داده ها شده است. در حالی که مطالب زیادی در مورد تفکر آماری نوشته شده است، یک شکل مکمل از تفکر که در عمل تجزیه و تحلیل داده ها ظاهر می شود، تفکر طراحی است - فرآیند حل مسئله برای درک افرادی که راه حل برای آنها طراحی شده است. برای یک مشکل معین، میتواند تفاوتهای قابل توجه یا ظریفی در نحوه ساخت، ایجاد یا طراحی تحلیل داده توسط یک تحلیلگر داده (یا تولیدکننده تجزیه و تحلیل داده) وجود داشته باشد، از جمله تفاوت در انتخاب روشها، ابزارها و گردش کار. این انتخاب ها می توانند بر روی خود محصولات تجزیه و تحلیل داده ها و تجربه مصرف کننده از تجزیه و تحلیل داده ها تأثیر بگذارند. بنابراین، نقش یک تولید کننده را می توان به عنوان طراحی تجزیه و تحلیل داده ها با مجموعه ای از اصول طراحی در نظر گرفت. در اینجا، ما اصول طراحی را برای تجزیه و تحلیل داده ها معرفی می کنیم و توضیح می دهیم که چگونه می توان آنها را به روشی کمی و آموزنده به تجزیه و تحلیل داده ها نگاشت کرد. ما همچنین داده هایی را ارائه می دهیم که تنوع اصول را در داخل و بین تولیدکنندگان تجزیه و تحلیل داده ها نشان می دهد. کار ما یک مکانیسم رسمی برای توصیف تجزیه و تحلیل داده ها بر اساس اصول طراحی پیشنهاد می کند. این نتایج راهنمایی برای کار آینده در توصیف فرآیند تحلیل داده ها ارائه می دهد.
توجه! این متن ترجمه ماشینی بوده و توسط مترجمین ای ترجمه، ترجمه نشده است.
Abstract
The data revolution has led to an increased interest in the practice of data analysis. While much has been written about statistical thinking, a complementary form of thinking that appears in the practice of data analysis is design thinking – the problem-solving process to understand the people for whom a solution is being designed. For a given problem, there can be significant or subtle differences in how a data analyst (or producer of a data analysis) constructs, creates, or designs a data analysis, including differences in the choice of methods, tooling, and workflow. These choices can affect the data analysis products themselves and the experience of the consumer of the data analysis. Therefore, the role of a producer can be thought of as designing the data analysis with a set of design principles. Here, we introduce design principles for data analysis and describe how they can be mapped to data analyses in a quantitative and informative manner. We also provide data showing variation of principles within and between producers of data analyses. Our work suggests a formal mechanism to describe data analyses based on design principles. These results provide guidance for future work in characterizing the data analytic process.
Introduction
The data revolution has led to an increased interest in the practice of data analysis (Box, 1976; Chatfield, 1995; Tukey, 1962; Tukey and Wilk, 1966; Wild, 1994; Wild and Pfannkuch, 1999). In the practice of data analysis, one often uses statistical thinking (Wild and Pfannkuch, 1999), namely the vague but intuitive process of aiming to accurately describe or understand uncertainties in a complex world using foundations from mathematics, statistics, computer science, psychology, and other fields of study (Snee, 1990; Chance, 2002; Poldrack, 2021). Statistical thinking often manifests where, for a given question or decision that needs to be made, a producer of a data analysis makes analytic choices, such as which methods, algorithms, computational tools, languages, or workflows to use in a data analysis that most accurately capture or describe a complex world (Grolemund and Wickham, 2014; Donoho, 2017). For example, a data analysis can consist of simply calculating the sample mean for a given set of observations. Alternatively, the producer may choose to calculate a sample median if they suspect there are outliers in the observed data. A data analysis can also be more complicated consisting of, for example, importing, cleaning, transforming, and modeling data with a goal to build a machine learning algorithm to decide which product a company should sell.
Results and analyses
In this section, we describe two case studies exploring the variation in the principles across different data analyses. Our approach to this analysis was exploratory with the goal of summarizing the between person and within person variation across the design principles. These two case studies consist of longitudinal data collected at Wake Forest University and cross-sectional data collected at Johns Hopkins University.