چکیده
ما دو سیستم برای طبقهبندی رابطه معنایی را توصیف میکنیم که با آنها در SemEval-2018 Task7 ، زیروظیفه 1 برای طبقهبندی رابطه معنایی شرکت کردیم که یکی مدل ماشین بردار پشتیبانی (SVM) و دیگری مدل شبکه عصبی پیچشی (CNN) بوده است. هر دوی مدلها ویژگیهای word2vec از پیش آموزش دیده متراکم و ویژگیهای تنک دستساز را ترکیب میکنند. برای آموزش مدلها، ما دو مجوعهداده را با زیروظایف ترکیب میکنیم تا بدین شکل به تعادل تحت کلاسهای ارائه شده برسیم. مدل SVM نسبت به مدل CNN عملکردی بهتر دارد و به نمره کلان F1 ای به میزان 98 .69% بر روی زیروظیفه 1 .1 و به به امتیاز 69 .75% بر روی زیروظیفه 1. 2 دست پیدا کرده است. رتبه این سیستم در بین 28 سیستم ارسالی بر روی زیروظیفه 1 .1، 7 ام بوده است و بر روی 20 سیستم ارسالی بر روی زیروظیفه 2 .1 نیز رتبه 7 ام را کسب کرده است.
1. مقدمه
استخراج رابطه یک وظیفه قدیمی در حوزه استخراج اطلاعات است که هدف آن شناسایی و طبقهبندی روابط معنایی بین نهادها در متن است (پاوار 2017). وظیفه اساسا ساختاری را از اطلاعات متنی بدون ساختار استنتاج میکند که به ما اجازه میدهد اطلاعات ارزشمندی در مورد نحوه تعامل نهادها را کسب کنیم بنابراین سبب بهبود ظرفیت انسانی برای تجزیه و تحلیل مقادیر (اغلب بسیار بزرگ) دادههای متنی میشود. استخراج رابطه به طور معمول به عنوان یک وظیفه طبقهبندی مطرح میشود: جفتهای موجود در یک سند بازرسی میشوند و نوع ارتباط با استفاده از نشانههای زبانشناسی محلی پیش بینی میشوند (کلوتا و همکاران 2006).
استخراج رابطه در پیشینه تحقیق به شکل گسترده مورد مطالعه قرار گرفته است برای مثال میتوانید به کار (کونستانتینوا 2014) برای یک بررسی اجمالی در مورد این موضوع رجوع کنید. اتزیون و همکاران در سال 2008 رویکردهای استخراج روابط را به سه کلاس گروهبندی کردند: 1) رویکردهای دانش محور 2) رویکردهای نظارتی و 3) رویکردهای خود نظارتی. رویکردهای سنتی عمدتا به مدلهای یادگیری ماشین های کم عمق با ویژگیهای دستساز (گودانگ 2005) و رویکردهای مختص هسته (زلانکو 2003) تکیه داشتند. برخی از سیستمها از دادههای بدون برچسب برای بهبود طبقهبندی استفاده میکردند و از یادگیری نیمه نظارتی و فاقد نظارت استفاده کردند (چن 2006، هاسیگاوار 2004). حالت فعلی صنعت مدل شبکه عصبی عمیقی است که توسط توسط ژو در سال 2016 ارائه شده است. بیشتر تحقیقات مربوط به استخراج رابطهها، از مجموعه دادههای بنچمارک استاندارد از ACE (دادگینتون و همکاران) و از SemEval-2018 Task8 (هندریک و همکاران 2009) بهره بردهاند.
5 نتیجهگیری
ما دو مدل را برای طبقهبندی رابطه توصیف کردیم که با آنها در SemEval-2018 Task7 ، زیروظیفه 1. 1 و 2 . 1 برای طبقهبندی رابطه معنایی شرکت کردیم که شامل یک مدل SVM و یک مدل CNN بود. مدلهای ما ترکیبی از ویژگیهای دست ساز تنک و ویژگیهای متراکم بر اساس جاسازی کلمات بوده است. اگر چه مدلهای یادگیری عمیق در حال حاضر در وظایف استخراج رابطه فوق العاده هستند ولی در مورد ما، احتمالا به دلیل مجموعه آموزشی نسبتا کوچک در دسترس، SVM عملکردی برتر نسبت به مدل CNN داشته است و رتبه هفتم را در هر دو بار اجرای ارزیابی داشته است. در کل این موضوع اثبات شد که وظایف به دلیل خصوصیت بسیار پیچیده این حوزه بسیار چالشبرانگیز بودهاند.
برای کارهای آتی ما قصدر داریم که مدلهای این کار را بر روی مجموعهداده بزرگتری با استفاده از نظارت از راه دور بر روی بدنه علمی در دسترس عمومی مجددا آموزش دهیم و همچنین آن را با جایگذاری word2vec خاص یک دامنه نیز امتحان کنیم.
Abstract
We describe two systems for semantic relation classification with which we participated in the SemEval 2018 Task 7, subtask 1 on semantic relation classification: an SVM model and a CNN model. Both models combine dense pretrained word2vec features and hancrafted sparse features. For training the models, we combine the two datasets provided for the subtasks in order to balance the under-represented classes. The SVM model performed better than CNN, achieving an F1-macro score of 69.98% on subtask 1.1 and 75.69% on subtask 1.2. The system ranked 7th among 28 submissions on subtask 1.1 and 7th among 20 submissions on subtask 1.2.
1 Introduction
Relation extraction is a traditional information extraction task which aims at detecting and classifying semantic relations between entities in text (Pawar et al., 2017). The task essentially induces structure from unstructured textual information, allowing us to obtain valuable information about the way in which entities interact, thus improving human capacity to analyze (often large) quantities of textual data. Relation extraction is typically framed as a classification task: pairs of entities from a document are inspected and the type of relation is predicted by means of local linguistic cues (Culotta et al., 2006).
Relation extraction has been extensively studied in the literature; see (Konstantinova, 2014) for a comprehensive overview. Etzioni et al. (2008) group the relation extraction approaches into three classes: (1) knowledge-based methods, (2) supervised methods, and (3) self-supervised methods. Traditional approaches mostly relied on shallow machine learning models with handcrafted features (GuoDong et al., 2005) and specific kernel methods (Zelenko et al., 2003). Some systems leverage unlabeled data to improve classification and use semi-supervised or unsupervised learning (Chen et al., 2006; Hasegawa et al., 2004). The current state of the art is a deep recurrent neural network model by Xu et al. (2016). Most research on relation extraction has leveraged standard benchmark datasets from the ACE (Doddington et al.) and SemEval-2010 Task 8 (Hendrickx et al., 2009).
5 Conclusion
We described two models for relation classification with which participated in the SemEval-2018 Task 7, subtasks 1.1 and 1.2 on relation classification: an SVM model and a CNN model. Our models combine sparse, handcrafted features and dense features based on word embeddings. Although deep learning models currently excels at relation extraction tasks, in our case, probably due to the small relatively small training set available, SVM outperformed the CNN model, ranking 7th in both evaluation runs. Overall, the tasks proved to be very challenging, mainly due to the peculiarities of the domain.
For future work, we intend to retrain our models on a larger dataset using distant supervision based on publicly available scientific corpora, and also experiment with training domain-specific word2vec embeddings.
چکیده
1. مقدمه
2 مجموعه داده
3 شرح سیستم
1. 3 مدل SVM
3.2 مدل CNN
4 ارزیابی و نتایج
5 نتیجهگیری
منابع
Abstract
1 Introduction
2 Dataset
3 System Description
3.1 SVM Model
3.2 CNN model
4 Evaluation and Results
5 Conclusion
References