دانلود مقاله TakeLab در SemEval-2018 Task7 ترکیبی از ویژگی های تنک  و متراکم برای طبقه بندی  رابطه‌ در متون علمی
ترجمه شده

دانلود مقاله TakeLab در SemEval-2018 Task7 ترکیبی از ویژگی های تنک و متراکم برای طبقه بندی رابطه‌ در متون علمی

عنوان فارسی مقاله: TakeLab در SemEval-2018 Task7 ترکیبی از ویژگی های تنک و متراکم برای طبقه بندی رابطه‌ در متون علمی
عنوان انگلیسی مقاله: TakeLab at SemEval-2018 Task 7: Combining Sparse and Dense Features for Relation Classification in Scientific Texts
رشته های تحصیلی مرتبط: مهندسی کامپیوتر
گرایش های تحصیلی مرتبط: مهندسی نرم افزار - مهندسی الگوریتم ها و محاسبات - علوم داده
شناسه دیجیتال (DOI): https://doi.org/10.18653/v1/S18-1135
لینک سایت مرجع: https://aclanthology.org/S18-1135/
نویسندگان: Martin Gluhak - Maria Pia di Buono - Abbas Akkasi - Jan Snajder
دانشگاه: دانشکده مهندسی برق و محاسبات دانشگاه زاگرب ، کرواسی
صفحات مقاله انگلیسی: 6
صفحات مقاله فارسی: 12
نوع ارائه مقاله: ژورنال
سال انتشار مقاله: 2018
ترجمه شده از: انگلیسی به فارسی
فرمت مقاله انگلیسی: pdf و ورد تایپ شده با قابلیت ویرایش
وضعیت ترجمه: ترجمه شده و آماده دانلود
فرمت ترجمه فارسی: pdf و ورد تایپ شده با قابلیت ویرایش
مشخصات ترجمه: تایپ شده با فونت B Nazanin 14
فرمول و علائم در ترجمه: ندارد
مقاله بیس: خیر
مدل مفهومی: ندارد
کد محصول: 12617
رفرنس: دارای رفرنس در داخل متن و انتهای مقاله
پرسشنامه: ندارد
متغیر: ندارد
فرضیه: ندارد
درج شدن منابع داخل متن در ترجمه: ترجمه و درج شده است
ترجمه شدن توضیحات زیر تصاویر و جداول: بله
ترجمه شدن متون داخل تصاویر و جداول: بله
رفرنس در ترجمه: در داخل متن و انتهای مقاله درج شده است
ضمیمه: ندارد
پاورقی: درج نشده است
نمونه ترجمه فارسی مقاله

چکیده
     ما دو سیستم برای طبقه‌بندی رابطه‌ معنایی  را توصیف می‌کنیم که با آن‌ها در SemEval-2018 Task7 ، زیروظیفه 1  برای طبقه‌بندی رابطه معنایی شرکت کردیم که یکی مدل ماشین بردار پشتیبانی (SVM) و دیگری مدل شبکه عصبی پیچشی (CNN) بوده است. هر دوی مدل‌ها ویژگی‌های word2vec از پیش آموزش دیده متراکم و ویژگی‌های تنک دست‌ساز را ترکیب می‌کنند. برای آموزش مدل‌ها، ما دو مجوعه‌داده‌  را با زیروظایف ترکیب می‌کنیم تا بدین شکل به تعادل تحت کلاس‌های ارائه شده برسیم. مدل SVM نسبت به مدل CNN عملکردی بهتر دارد و به نمره کلان F1 ای به میزان 98 .69% بر روی زیروظیفه 1 .1 و به به امتیاز 69 .75% بر روی زیروظیفه 1. 2 دست پیدا کرده است. رتبه این سیستم در بین 28 سیستم ارسالی بر روی زیروظیفه 1 .1، 7 ام بوده است و بر روی 20 سیستم ارسالی بر روی زیروظیفه 2 .1 نیز رتبه 7 ام را کسب کرده است.

 

1. مقدمه
     استخراج رابطه یک وظیفه قدیمی در حوزه استخراج اطلاعات است که هدف آن شناسایی و طبقه‌بندی روابط معنایی بین نهادها در متن است (پاوار  2017). وظیفه اساسا ساختاری را از اطلاعات متنی بدون ساختار استنتاج می‌کند که به ما اجازه می‌دهد اطلاعات ارزشمندی در مورد نحوه تعامل نهاد‌ها را کسب کنیم بنابراین سبب بهبود ظرفیت انسانی برای تجزیه و تحلیل مقادیر (اغلب بسیار بزرگ) داده‌های متنی می‌شود. استخراج رابطه به طور معمول به عنوان یک وظیفه طبقه‌بندی مطرح می‌شود: جفت‌های موجود در یک سند بازرسی می‌شوند و نوع ارتباط با استفاده از نشانه‌های زبان‌شناسی  محلی پیش بینی می‌شوند (کلوتا  و همکاران 2006). 
     استخراج رابطه در پیشینه تحقیق به شکل گسترده مورد مطالعه قرار گرفته است برای مثال می‌توانید به کار (کونستانتینوا  2014) برای یک بررسی اجمالی در مورد این موضوع رجوع کنید. اتزیون و همکاران در سال 2008 رویکردهای استخراج روابط را به سه کلاس گروه‌بندی کردند: 1) رویکردهای دانش محور 2) رویکردهای نظارتی و 3) رویکردهای خود نظارتی. رویکردهای سنتی عمدتا به مدل‌های یادگیری ماشین های کم عمق با ویژگی‌های دست‌ساز (گودانگ 2005) و رویکردهای مختص هسته (زلانکو 2003) تکیه داشتند. برخی از سیستم‌ها از داده‌های بدون برچسب برای بهبود طبقه‌بندی استفاده می‌کردند و از یادگیری نیمه نظارتی و فاقد نظارت استفاده کردند (چن 2006، هاسیگاوار 2004). حالت فعلی صنعت مدل شبکه عصبی عمیقی است که توسط توسط ژو در سال 2016 ارائه شده است. بیشتر تحقیقات مربوط به استخراج رابطه‌ها، از مجموعه داده‌های بنچمارک استاندارد از ACE (دادگینتون و همکاران) و از SemEval-2018 Task8 (هندریک و همکاران 2009) بهره‌ برده‌اند.

5 نتیجه‌گیری
     ما دو مدل را برای طبقه‌بندی رابطه توصیف کردیم که با آن‌ها در SemEval-2018 Task7 ، زیروظیفه 1. 1 و 2 . 1 برای طبقه‌بندی رابطه معنایی شرکت کردیم که شامل یک مدل SVM و یک مدل CNN بود. مدل‌های ما ترکیبی از ویژگی‌های دست ساز تنک و ویژگی‌های متراکم بر اساس جاسازی کلمات بوده است. اگر چه مدلهای یادگیری عمیق در حال حاضر در وظایف استخراج رابطه فوق العاده هستند ولی در مورد ما، احتمالا به دلیل مجموعه‌‌ آموزشی نسبتا کوچک در دسترس، SVM عملکردی برتر نسبت به مدل CNN داشته است و رتبه هفتم را در هر دو بار اجرای ارزیابی داشته است. در کل این موضوع اثبات شد که وظایف به دلیل خصوصیت بسیار پیچیده این حوزه بسیار چالش‌برانگیز بوده‌اند.
     برای کارهای آتی ما قصدر داریم که مدل‌های این کار را بر روی مجموعه‌داده بزرگ‌تری با استفاده از نظارت از راه دور بر روی بدنه علمی در دسترس عمومی مجددا آموزش دهیم و همچنین آن را با جایگذاری word2vec خاص یک دامنه نیز امتحان کنیم.

نمونه متن انگلیسی مقاله

Abstract

     We describe two systems for semantic relation classification with which we participated in the SemEval 2018 Task 7, subtask 1 on semantic relation classification: an SVM model and a CNN model. Both models combine dense pretrained word2vec features and hancrafted sparse features. For training the models, we combine the two datasets provided for the subtasks in order to balance the under-represented classes. The SVM model performed better than CNN, achieving an F1-macro score of 69.98% on subtask 1.1 and 75.69% on subtask 1.2. The system ranked 7th among 28 submissions on subtask 1.1 and 7th among 20 submissions on subtask 1.2.

1 Introduction

     Relation extraction is a traditional information extraction task which aims at detecting and classifying semantic relations between entities in text (Pawar et al., 2017). The task essentially induces structure from unstructured textual information, allowing us to obtain valuable information about the way in which entities interact, thus improving human capacity to analyze (often large) quantities of textual data. Relation extraction is typically framed as a classification task: pairs of entities from a document are inspected and the type of relation is predicted by means of local linguistic cues (Culotta et al., 2006).

     Relation extraction has been extensively studied in the literature; see (Konstantinova, 2014) for a comprehensive overview. Etzioni et al. (2008) group the relation extraction approaches into three classes: (1) knowledge-based methods, (2) supervised methods, and (3) self-supervised methods. Traditional approaches mostly relied on shallow machine learning models with handcrafted features (GuoDong et al., 2005) and specific kernel methods (Zelenko et al., 2003). Some systems leverage unlabeled data to improve classification and use semi-supervised or unsupervised learning (Chen et al., 2006; Hasegawa et al., 2004). The current state of the art is a deep recurrent neural network model by Xu et al. (2016). Most research on relation extraction has leveraged standard benchmark datasets from the ACE (Doddington et al.) and SemEval-2010 Task 8 (Hendrickx et al., 2009).

5 Conclusion

     We described two models for relation classification with which participated in the SemEval-2018 Task 7, subtasks 1.1 and 1.2 on relation classification: an SVM model and a CNN model. Our models combine sparse, handcrafted features and dense features based on word embeddings. Although deep learning models currently excels at relation extraction tasks, in our case, probably due to the small relatively small training set available, SVM outperformed the CNN model, ranking 7th in both evaluation runs. Overall, the tasks proved to be very challenging, mainly due to the peculiarities of the domain.

     For future work, we intend to retrain our models on a larger dataset using distant supervision based on publicly available scientific corpora, and also experiment with training domain-specific word2vec embeddings.

تصویری از فایل ترجمه

    

    

(جهت بزرگ نمایی روی عکس کلیک نمایید)

ترجمه فارسی فهرست مطالب

چکیده
1. مقدمه
2 مجموعه داده
3 شرح سیستم
1. 3 مدل SVM
3.2 مدل CNN
4 ارزیابی و نتایج
5 نتیجه‌گیری
منابع

فهرست انگلیسی مطالب

Abstract
1 Introduction
2 Dataset
3 System Description
3.1 SVM Model
3.2 CNN model
4 Evaluation and Results
5 Conclusion
References

محتوای این محصول:
- اصل مقاله انگلیسی با فرمت pdf
- اصل مقاله انگلیسی با فرمت ورد (word) با قابلیت ویرایش
- ترجمه فارسی مقاله با فرمت ورد (word) با قابلیت ویرایش، بدون آرم سایت ای ترجمه
- ترجمه فارسی مقاله با فرمت pdf، بدون آرم سایت ای ترجمه
قیمت محصول: ۳۱,۸۰۰ تومان
خرید محصول
بدون دیدگاه