چکیده
تمایز های موجود بین علم و رسانه ها، همیشه بر روی ارتباط علمی تاثیر داشته است. یافته های اصلی از نشریات علمی ممکن است با قوت ادعاهای مطرح شده در اخبار برای عموم، دچار تحریف شود و همین موضوع موجب میشود که اطلاعات اشتباه منتشر شود. این مطالعه یک تحلیل NLP را بر روی ادعاهای بزرگ نمایی شده در اخبار علمی انجام میدهد و سپس مدل های پیش بینی را برای شناسایی سطح قدرت ادعا ها در گزارش های علمی، ایجاد میکند. نتایج نشان دهنده ی سبک نوشتاری مختلف در مقاله های علمی و گزارش های اخبار علمی میباشد که در زمینه ی گزارش یافته های مختلف علمی مورد استفاده قرار میگیرد. مدل های پیش بینی اولیه نتایج خوبی را ، همراه با ظرفیت برای بهبود بیشتر، نشان داد.
1. مقدمه
در 18 آپریل در 2017، بسیاری از آژانس های اخبار علمی یک مطالعه ی جدید بر روی تاثیرات افراد هم رده بر روی رفتار بهداشتی را گزارش دادند. در ادامه بعضی از نمونه های تیتر ها را برای شما بیان میکنیم :
AAAS : اگر شما یک مرد هستید، تمرین کردن برای شما حالت مسری دارد
گزارش اخبار MIT Sloan : مشخص شده است که ورزش کردن حالت مسری دارد.
Messcape : تمرین کردن و ورزش ممکن است حالت مسری داشته باشد
Gulfnews : تحلیل های جدید شبکه های اجتماعی نشان داده است که ورزش کردن حالت مسری دارد
بدون در نظر داشتن یافته های اصلی، این تیتر ها با سطح قدرت مختلف یافته ها را تفسیر کرده و آن ها را گزارش کرده اند ( با استفاده از افعالی مانند "ممکن است، شاید، و میتواند").
این نمونه نشان دهنده ی یک مشکل غالب در ارتباطات علمی میباشد که در این روند ممکن است اطلاعات اصلی علمی تغییر کرده و یا در طول روند گسترش، با تحریف رو به رو شوند. واحد های مختلف اطلاعاتی مانند اخبار دانشگاه ها و دیگر گزارش ها اخیرا به صورت گسترده برای اطلاع رسانی مورد استفاده قرار گرفته است. اما، احتمالا به دلیل اهداف نوشتاری مختلف از طرف نویسنده و مجلات، نسخه های مختلف با لغت بندی های مختلف از یافته های اصلی را میتوان در گزارش ها مشاهده کرد که ممکن است خیلی صحیح نباشند. به عنوان مثال، اخبار دانشگاه ها یکی از مهم ترین منابع ارائه ی اطلاعات غلط میباشد.
Abstract
The discrepancy between science and media has been affecting the effectiveness of science communication. Original findings from science publications may be distorted with altered claim strength when reported to the public, causing misinformation spread. This study conducts an NLP analysis of exaggerated claims in science news, and then constructed prediction models for identifying claim strength levels in science reporting. The results demonstrate different writing styles journal articles and news/press releases use for reporting scientific findings. Preliminary prediction models reached promising result with room for further improvement.
1 Introduction
On April 18, 2017 many science news agencies reported a new study on peer effects in health behavior (Aral and Nicolaides, 2017). Here are a few examples of the headlines:
AAAS: “Exercise is contagious, especially if you are a men” MIT Sloan press release: “Turns out exercise is contagious” Medscape: “Exercise may be contagious” Gulfnews: “Exercise can be contagious, new social network analysis finds”.
Regardless of the original finding, these news headlines interpreted and thus reported the finding with different levels of strength (using different verbs such as “is”, “may”, and “can”).
This example illustrates a prominent problem in science communication that original scientific findings might be altered or distorted during the information spread process. Different information subsidies such as the university press and news releases have been widely used to deliver research findings. However, possibly caused by different writing purposes of scientists and journalists, those paraphrased versions of the original findings in the reporting may not be as accurate. For example, the university press release has been found to be a major source of misinformation (Sumner et al., 2014).
چکیده
1. مقدمه
2. کار های مرتبط
3. آزمایش ها
3.1 داده ها
3.2 پردازش داده ها
3.3 استخراج ویژگی
3.4 نتایج طبقه بندی
4. تحلیل خطا
5. جمع بندی
Abstract
1 Introduction
2 Related Work
3 Experiment
3.1 Data
3.2 Data Preprocessing
3.3 Feature Extraction
3.4 Classification Results
4 Error Analysis
5 Conclusion