چکیده
هدف این مقاله یافتن مهم ترین عوامل موثر بر فروش فراورده های لبنی می باشد. داده های معاملاتی برای فروش استفاده می شوند. این مقاله برای اولین بار منتشر می شود. نتایج تجزیه تحلیل نشان می دهد که چگونه داده های معاملاتی را می توان برای داده کاوی مورد استفاده قرار داد. نرم افزار SPSS برای تجزیه تحلیل داده ها مورد استفاده قرار می گیرد. روش های آماری( نظیر آزمون t نمونه های مستقل، آزمون کای اسکوئر، آزمون u من-ویتنی، آزمون تجزیه واریانس یک طرفه) برای یافتن وابستگی ها استفاده می شود. ما فرض می کنیم که مقدار فروش بستگی به سال، ماه، آیتم و قیمت میانگین دارد. در پایان مطالعه، پی برده شد که سال و گروه عواملی هستند که بیشترین تاثیر را بر روی مقدار فروش دارند. عواملی نظیر ماه، آیتم و قیمت متوسط فروش تاثیری بر مقدار یک فروش ندارند. فرمول های ریاضی برای پیش پینی مقدار یک فروش آینده بر اساس متغیر های مستقل نظیر سال و گروه ساخته می شوند.
1-مقدمه
تجزیه تحلیل فروش، یک روش رایج و عملی می باشد. سیستم های POS ماهیانه تولید هزاران معامله و تراکنش می کنند. همه این معاملات را می توان برای تجزیه تحلیل داده ها مورد استفاده قرار داد. ساده ترین شیوه تجزیه تحلیل، گزارش فروش بر اساس سالیانه، ماهیانه یا فصلی است. یک بررسی دقیق تر امکان دسترسی به داده های معاملاتی را می دهد. جداول محوری یا جداول کراس تب را می توان در زمان دسته بندی فروش بر اساس دو فاکتور- برای مثال ماه و سال- تولید کرد. دسته بندی را می توان بر اساس مشتریان یا محصولات انجام داد. همه این گزارش ها از پرس و جو های گزینشی ساده برای استخراج داده ها در چارچوب سیستم های مدیریت پایگاه اطلاعاتی استفاده می کنند(DBMS). پرس و جو های گزینشی را هم چنین می توان برای دسته بندی داده ها مورد استفاده قرار داد. دسته بندی داده ها به کار بر نهایی امکان تولید گزارش های سفارشی ترکیبی( کل) را می دهد. معمولا یک متغیر( یا چند متغیر) برای دسته بندی استفاده شده و متغیر دیگر( متغیر های دیگر) برای خلاصه سازی داده ها استفاده می شوند. اولین متغیر( اولین گروه از متغیر ها) می توانند دارای مقادیر متنی باشند(برای مثال EAN، نام مشتری و ماه). دومین مورد( دومین گروه از متغیر ها) بایستی دارای مقادیر عددی به منظور انجام محاسبات با استفاده از دستورات SUM, AVERAGE, STDEV( به ترتیب دستورات جمع، میانگین، انحراف معیار) یا دستورات دیگر باشد. روش دسته بندی داده های معاملاتی امکان پنهان کردن داده های محرمانه را می دهد. مقادیر خلاصه شده، نشان دهنده مقادیر هر معامله نمی باشند. آن ها هم چنین تعداد معاملات را نشان نمی دهند.داده کاوی یک روش شناخته شده برای تجزیه تحلیل مجموعه داده ها می باشد. هدف استفاده از داده کاوی، یافتن وابستگی و همبستگی درون داده هایی است که با استفاده از پرس و جو های گزینشی ساده و گزارش های فروش قابل نشان گذاری یا برجسته سازی نیستند.
Abstract
The purpose of this article is to find out the most important factors for sales of dairy products. Transactional data for sales are used. This article is published for the first time. The results of the analysis will show how transactional data may be used for data mining. SPSS is used to analyze the data. Statistical methods (such as independent samples t-test, Chi-square tests, Mann-Whitney U test, one-way ANOVA test) are applied to find dependencies. We suppose that the quantity of sales depends on the year, month, group, item and average price. At the end of the study we found out that “year” and “group” are factors which mostly influence the quantity of a sale. Factors “month”, “item” and “average sale price” do not affect the quantity of a single sale. Mathematical formulas are derived to predict the quantity of a future sale on the basis of independent variables such as year and group of stock.
1. Introduction
Sales analysis is a common technique adapted in practice. POS systems generate thousands of transactions monthly. All these transactions may be used to analyze data. The simplest way of analysis is to report sales on a yearly, monthly or quarterly basis. A more detailed view allows drilling down the transactional data. Pivot tables or crosstab tables may be produced when grouping the sales on two factors – for instance month and year. Grouping may be done by customers and products. All these reports use simple SELECT queries for extracting data within database management systems (DBMS). Select queries may be also used for grouping of data. Grouping of data allows the end user to generate custom aggregated reports. Usually one variable (or more variables) is used for grouping and another variable (variables) is used for summarizing data. The first variable (the first group of variables) may have text values (for instance EAN, customer name, and month). The second one (the second group of variables) must have numeric values in order to make calculations – using the function SUM, AVERAGE, STDEV or another one. The technique for grouping transactional data allows confidential data to be hidden. Summarized values do not show the values of each transaction. They also do not show the number of transactions. Data mining is a well-known technique for analyzing datasets. The purpose of the application of data mining is to find dependencies within data which may not be marked or highlighted by simple select queries and sales reports.
چکیده
1-مقدمه
2-تحقیقات اخیر در رابطه با تجزیه تحلیل فروش
3-مجموعه داده های مورد استفاده برای داده کاوی
5-تجزیه تحلیل داده های فروش
5-1 آزمون فرضیه 1: مقدار فروش بستگی به سال دارد
5-2:آزمون فرضیه 2: مقدار فروش بستگی به ماه دارد
5-3 آزمون فرضیه 3- مقدار فروش بستگی به گروه دارد
5-4 آزمون فرضیه 4: مقدار فروش بستگی به آیتم دارد
5-5 آزمون فرضیه 5: مقدار فروش بستگی به قیمت متوسط دارد
6-اظهارات پایانی. بحث
نتیجه گیری
Abstract
1. Introduction
2. Recent research on sales analysis
3. Dataset used for data mining
4. Defining hypothesis
5. Analyzing sales data
5.1. Testing H1 – does the quantity of sales depends on the year
5.2. Testing H2 – does the quantity of sales depend on the month
5.3. Testing H3 – does the quantity of sales depend on the group
5.4. Testing H4 – does the quantity of sales depend on the item
5.5. Testing H5 – does the quantity of sales depend on the average price
6. Final remarks. Discussion
Conclusions