چکیده
در این مقاله افزون بر ارائه ی ویژگی های مالی، یک چهارچوب نوین پیش می نهیم که با تلفیق کردن ویژگی های لحن عاطفیِ مستخرج از اظهار نظرها در تالارهای آنلاین بورس، بحث و تحلیل مدیریت، و نکات صورت های مالی، درماندگی مالی را پیش بینی می کند. ما چهارچوب پیشنهادی را با استفاده از داده های مربوط به بازار بورس چین در فواصل سال های 2016 تا 2020 ارزیابی می کنیم. ما درمی یابیم که شرکت های دچار درماندگی مالی با احتمال بیش-تری دارای لحن عاطفی ضعیفی هستند چون سرمایه گذاران نگرش منفی نسبت به وضعیت عملیاتی و مالی آن شرکت ها دارند، در حالی که شرکت های عادی وضعیت عکس دارند. افزون بر این، لحن عاطفی اظهار نظرها در طول یک ماه به طور کارامدی این همبستگی ها را منعکس می کند. ما گنجاندن ویژگی های لحن عاطفی را توصیه می کنیم چون آن ها به بهبودی عملکرد پیش بینی همه ی مدل هایی که صرفاً از ویژگی های مالی استفاده می کنند، می انجامند، و همچنین استفاده از مدل CatBoost را توصیه می کنیم چون نسبت به همه ی مدل های معیار عملکرد بهتری دارد و از این توانایی برخوردار است که روابط میان ویژگی های پیچیده را استخراج کند. تحلیل مزایای اقتصادی نشان می-دهد که چهارچوب پیشنهادی می تواند به درستی شرکت های از نظر مالی درمانده تر را شناسایی کند.
1- مقدمه
با گسترش مستمر حجم بازار اوراق بهادار و توسعه ی تدریجی بازار سرمایه، شرکت ها با محیط های اقتصادی بسیار پیچیده و متغیر و فشار رقابتی عظیمی رو به رو هستند (لیو و همکاران، 2020). بدون یک سازوکار مناسب برای تطبیق دادن با این محیط، شرکت ها با احتمال بیش تری به مسائل و مشکلاتی برمی خورند، مانند نقدینگی ناکافی و بدهی های فراوان، که در نهایت منجر به درماندگی مالی می شوند (وانگ و همکاران، 2018). درماندگی مالی به عنوان یکی از نگران کننده ترین مسائل در حوزه ی اقتصادی می تواند به طور نامطلوبی بر توسعه ی پایدار شرکت ها تأثیر بگذارد، بقای آن ها را تهدید کند، و منجر به زیان های هنگفت برای سرمایه گذاران، بستانکاران، مشتریان، و دیگر ذینفعان (بهره وران) شود (کیم و اوپنجا، 2014). هنگامی که شمار شرکت های در وضعیت درماندگی مالی به یک سطح مشخص می رسد، ممکن است درماندگی مالی اجتماعی رخ دهد و ثبات و پایداری توسعه ی اقتصاد کلان ممکن است به خطر بیفتد (مای و همکاران، 2019).
6- نتیجه گیری
توانایی پیش بینی کردن به هنگام و کارامد درماندگی مالی برای تصمیم گیری شرکت ها و ذینفعان مهم است. بنابراین، پژوهشگران مدت هاست که توجه ویژه ای به تدوین و طراحی مدل پیش بینی درماندگی مالی با عملکرد افتراقی بالاتر مبذول داشته اند. به دست آوردن ویژگی های معتبر و ساختن مدل هایی با عملکرد بالا، مولفه های ارزشمندی برای بهبود توانایی پیش بینی دقیق درماندگی مالی هستند. در این مقاله، ما استفاده از تلفیق اطلاعات مالی پایه ای و دیگر اطلاعات متنی و CatBoost برای بهبود عملکرد افتراقی پیش بینی درماندگی مالی شرکت های ثبت شده را مطالعه می کنیم. ما چهارچوبی را پیشنهاد می کنیم که ویژگی های لحن عاطفی مستخرج از تالارهای آنلاین بورس، بحث و تحلیل مدیریت، و نکات صورت های مالی را تلفیق می کند. به ویژه، ما ویژگی های مرتبط را از تالارهای آنلاین بورس استخراج می کنیم و اثبات می کنیم که این ویژگی ها می توانند به طور چشمگیری صحت پیش بینی درماندگی مالی را بهبود ببخشند. ما تأثیر تالارهای آنلاین بورس طی مقاطع زمانی گوناگون و ویژگی های لحن عاطفی گوناگون بر مدل پیش بینی درماندگی مالی را بررسی می کنیم. ما همچنین شش مدل با استفاده از LR، DT، SVM، XGBoost و ANN طراحی می کنیم و عملکرد CatBoost با پنج مدل معیار دیگر به ازای مجموعه ویژگی های گوناگون مقایسه می شود.
Abstract
In addition to financial features, we propose a novel framework that combines sentiment tone features extracted from comments on online stock forums, management discussion and analysis, and financial statement notes, to predict financial distress. We evaluate the proposed framework using data from the Chinese stock market between 2016 and 2020. We find that financially distressed companies are more likely to have weak sentiment tones as investors have a negative attitude toward the operation and financial status of the companies, while normal companies are to the contrary. Additionally, the sentiment tones of comments within one month most effectively reflect such correlations. We recommend incorporating sentiment tone features as they contribute to predictive performance improvements of all models using financial features only, and using the CatBoost model as it outperforms all benchmarked models with its ability to capture complex feature relationships. Economic benefits analysis shows that the proposed framework can correctly identify more financially distressed companies.
1. Introduction
With the continuous expansion of the scale of the securities market and the gradual development of the capital market, companies are facing highly complex and changeable economic environments and huge competitive pressure (Liu et al., 2020). Without a good mechanism to adapt to this environment, companies are more likely to encounter problems, such as insufficient liquidity and excessive liabilities, which eventually lead to financial distress (Wang et al., 2018). As one of the most concerning issues in the economic field, financial distress can adversely affect the sustainable development of companies, threaten their survival, and result in huge losses to investors, creditors, customers, and other stakeholders (Kim and Upneja, 2014). When the number of companies in financial distress accumulates to a certain level, social financial distress may occur and the stability and sustainability of macroeconomic development may be endangered (Mai et al., 2019).
6. Conclusion
The ability to predict financial distress timely and effectively is important for the decision-making of companies and stakeholders. Therefore, researchers have paid close attention toward developing a financial distress prediction model with higher discrimination performance for a long time. Obtaining valid features and building highperformance models have proven to be important directions for improving the ability to accurately predict financial distress. In this paper, we study the use of COSF to supplement basic financial information and other text information and CatBoost to improve the discrimination performance of predicting the financial distress of listed companies. We propose a framework that combines sentiment tone features extracted from COSF, MD&A, and FSN. Specifically, we extract relevant features from COSF and prove that these features can significantly improve the accuracy of predicting financial distress. We examine the impact of COSF during different periods and different sentiment tone features on the financial distress prediction model. We also build six models using CatBoost, LR, DT, SVM, XGBoost, and ANN, and the performance of CatBoost is compared with the other five benchmark models on different feature sets.
چکیده
1- مقدمه
2- مروی بر پیشینه
2-1 ویژگی ها در پیش بینی درماندگی مالی
2-2 مدل های پیش بینی درماندگی مالی
3- طرح پژوهشی
3-1 مبنای نظری
3-2 کسب داده
3-3 پردازش داده و استخراج ویژگی
3-3-1 ویژگی های مالی
3-3-2 ویژگی های متنی
3-3-3 انتخاب مقطع زمانی اظهارنظرها در تالار آنلاین بورس
3-4 ساخت مدل
3-4-1 CatBoost
3-4-2 دیگر مدل ها
4- ارزیابی تجربی
4-1 مجموعه داده ی آزمایشی
4-2 انتخاب ویژگی های مالی
4-3 مقیاس های ارزیابی
4-4 انتخاب مقطع زمانی اظهار نظرها در تالارهای آنلاین بورس
5- نتایج آزمایشی و بحث
5-1 نتایح آزمایشی و تحلیل
5-2 مزایای اقتصادی چهارچوب پیش بینی پیشنهادی
5-3 آزمون استواری
6- نتیجه گیری
منابع
Abstract
JEL classification
1. Introduction
2. Literature review
2.1. Features in financial distress prediction
2.2. Models of predicting financial distress
3. Research design
3.1. Theoretical foundation
3.2. Data acquisition
3.3. Data processing and feature extraction
3.3.1. Financial features
3.3.2. Text features
3.3.3. Selecting the period of comments on online stock forums
3.4. Model construction
3.4.1. CatBoost
3.4.2. Other models
4. Empirical evaluation
4.1. Experimental dataset
4.2. Selecting financial features
4.3. Evaluation metrics
4.4. Selecting the period of comments on online stock forums
5. Experimental results and discussion
5.1. Experimental results and analysis
5.2. The economic benefits of the proposed prediction framework
5.3. Robustness test
6. Conclusion
Acknowledgment
References