چکیده
با توسعه سریع اینترنت، داده های متنی پربارتر می شوند، اما بخش عمده آن، ساختار نیافته است. بنابراین، بهره-برداری از داده های متنی در مقایسه با داده های آماری، سخت تر است. نحوه کاربرد انفورماتیک در متن کاوی شبکه مالی، مکملی برای روش های تحقیق سنتی سرمایه است. این مقاله، سعی می کند تا نوسان نرخ ارز را از طریق انفورماتیک در استخراج شبکه مالی به وسیله محاسبات عاطفی، پیش بینی کند. ما در می یابیم که اگر میزان انفورماتیک در شبکه، طی پیش بینی به کار رود، تنها مقادیر اوج و کمینه نوسان آن، با نوسان نرخ ارز، همگام هستند. این در حالی است که، نوسان شدت عاطفی کلمات انفورماتیک روی شبکه در داده های متنی، می تواند به طور دقیق، نه تنها نوسان جدی نرخ ارز را، بلکه همچنین نوسان معتدل را نیز، پیش بینی کند.
مقدمه
اخیرا، بسیاری از ارزها، یک تنزیل قیمت قابل ملاحظه در برابر دلار ایالات متحده تجربه کرده اند، که باعث نگرانی بسیاری از سرمایه گذاران و سیاست گذاران شده است. از این رو، نحوه پیش بینی دقیق گرایش آینده نرخ ارز، وظیفه اصلی محققان کنونی شده است. روش های سنتی بسیاری برای پیش بینی گرایش آینده متغیرهای مالی وجود دارند، مانند روش احتمال، روش سیگنال، روش چرخشی مارکوف، روش شبکه ای و غیره. اما این روش ها، در مواجهه با داده های متنی آنلاین، مفید نیستند. بنابراین این مقاله، سعی می کند تا بررسی کند که آیا نرخ تبادل را می توان به طور دقیق و صحیح از طریق انفورماتیک در متن کاوی شبکه مالی پیش بینی کرد یا خیر.
نتیجه گیری
از طریق انفورماتیک در استخراج شبکه مالی با استفاده از رایانش توزیع شده، که از طریق پلتفرم SparkR محقق میشود، که در آن تکنولوژی محاسبات توزیع شده معرفی شده است، مقاله می آزماید که آیا داده های متنی می تواند برای پیش بینی نوسانات نرخ ارز بین RMB و دلار آمریکا مورد استفاده قرار گیرد یا خیر. مطالعه دریافت که:
(1) در اکثر موارد نوسانات میزان انفورماتیک در شبکه همیشه سازگار نیست و گاهی اوقات مخالف است. در حالی که مقادیر اوج نوسانات میزان اطلاعات نوسان نرخ ارز همزمان/همگام است، مقادیر دره ای/کف نیز به همین ترتیب است.
(2) نوسانات مقدار انفورمتریک عاطفی در شبکه بیشتر به نوسانات نرخ ارز نزدیک است، اما برخی نوسانات روزانه نرخ ارز نیز وجود دارد که چندان به میزان اطلاعات عاطفی داده های متنی نزدیک نیست. این ها ممکن است ناشی از واکنش پس از سقوط بیش از حد و یا فروش پس از سود، و غیره باشد که منجر به نوسانات مقدار اطلاعات عاطفی از داده های متنی می شود و نرخ ارز به طور کامل مطابقت نخواهد داشت. بنابراین این مطالعه بر این باور است که جدا از این نوسانات روزانه، نوسان میزان اطلاعات عاطفی داده های متنی اساساً به نوسانات نرخ ارز مربوط می شود.
Abstract
With the rapid development of internet, text data is becoming richer, but most part of them is unstructured. So compared to statistics data, the text data is more difficult to be utilized. How to apply the informetrics on financial network text mining is a supplement to the traditional research methods of finance. The paper tries to forecast exchange rate volatility through informetrics on financial network text mining by means of affective computing. We find that if the amount of informetrics on network is used during predicting, only the peak and valley values of its volatility and are synchronous with the volatility of exchange rate. While the volatility of emotional intensity of words of informetrics on network in text data can accurately predict not only the drastic volatility of exchange rate, but also the moderate volatility.
Introduction
Recently, many currencies have seen a significant devaluation against the U.S. dollar, which has caused many investors and policymakers to worry. Therefore, how to accurately predict the future trend of the exchange rate has become the main task of current researchers. There are many traditional methods to predict the future trend of financial variables, such as probability method, signal method, Markov switching approach, network method, etc. But these methods are helpless facing online text data. So this paper tries to explore whether the exchange rate can be accurately predicting through informetrics on financial network text mining.
Conclusion
Through informetrics on financial network mining by means of affective computing, which is realized through the SparkR platform, in which the distributed computing technology is introduced, the paper tests whether text data can be used to forecast the volatility of exchange rate between RMB and U.S. dollar. It finds that:
(1) In most cases the volatility of the amount of informetrics on network are not always consistent and sometime opposite. While the peak values of the volatility of the amount of information of the exchange rate volatility is synchronous, so are the valley values.
(2) The volatility of the amount of emotional informetrics on network is more closer to the volatility of exchange rate, but there are also some daily volatility of exchange rate that are not so close to the amount of emotional information of the text data.
چکیده
مقدمه
2. انفورماتیک در اینترنت به وسیله رایانش عاطفی
3. پلتفرم SparkR و الگوریتم استخراج شبکه
3.1. اطلاعات شبکه پیش پردازش
3.2. تحقق توزیع الگوریتم های CART و توده تصادفی بر SparkR
3.2.1. تولید الگوریتم توزیع SparkR از CART
3.2.2. درک توزیع الگوریتم توده تصادفی
3.3. درک الگوریتم خوشه بندی بر توزیع SparkR
آزمایشات و آنالیز نتایج
4.1. تاثیر انفورماتیک بر اینترنت و بر نوسانات نرخ ارز
4.2. آزمایش 1
4.3. آزمایش 2
4.4. آزمایش 3
نتیجه گیری
منابع
ABSTRACT
Introduction
2. Informetrics on Internet by Means of Affective Computing
3. SparkR Platform and the Algorithm of Network Mining
3.1. Preprocessing Network Information
3.2. Realization of Distribution of CART and Random Forest Algorithms on SparkR
3.2.1. Generating algorithm of SparkR distribution of CART
3.2.2. Realizing the Distribution of Random Forest Algorithm
3.3. Realization of Clustering Algorithm on SparkR Distribution
Experiments and Analysis of Results
4.1. The Impact of Informetrics on Internet on Volatility of Exchange Rate
4.2. Experiment 1
4.3. Experiment 2
4.4. Experiment 3
Conclusion
References