پیش بینی به هنگام تولید ناخالص داخلی ایران با استفاده از تحلیل احساس اخبار اقتصادی (مقاله علمی وزارت علوم)
درجه علمی: نشریه علمی (وزارت علوم)
آرشیو
چکیده
این پژوهش، روشی برای کمّی سازی اطلاعات بدون ساختار اخبار اقتصادی برای به کارگیری در ارزیابی به هنگام شرایط اقتصادی را پیشنهاد می دهد. به همین منظور، اخبار اقتصادی به صورت روزانه از ابتدای سال 1384 تا انتهای آذرماه سال 1402، از پایگاه اینترنتی خبرگزاری فارس استخراج شده است. متون خبری، پس از پیش پردازش اولیه، با استفاده از مدل تخصیص پنهان دیریکله (LDA) در دسته های مختلفی طبقه بندی شدند به نحوی که هر دسته، یک موضوع خبری را نشان می دهد. سپس با استفاده از رویکرد تحلیل احساس مبتنی بر واژه نامه، امتیاز یا نمره حسی هر خبر مشخص شده است. از تجمیع فصلی امتیازات حسی اخبار ذیل هر موضوع، سری های زمانی حسی ایجاد و توانایی این سری های زمانی در پیش بینی تولید ناخالص داخلی فصلی ایران با استفاده از روش های ریج، لسو، الستیک نت و تقویت گرادیان ارزیابی شده اند. نتایج نشان داده اند که به کارگیری داده های حسی می تواند خطای پیش بینی را بین 12 تا 18 درصد نسبت به الگوی سری زمانی تک متغیره کاهش دهد. علاوه بر این، با استفاده از رویکرد پیشنهادی این پژوهش می توان بلافاصله بعد از اتمام هر فصل مرجع و با استفاده از اخبار اقتصادی منتشر شده در همان فصل، برآوردی به هنگام از تولید ناخالص داخلی فصلی ارائه کردNowcasting Iran's GDP Using Sentiment Analysis of Economic News
This study examines textual data's ability to nowcast Iran's gross domestic product (GDP). To this end, 301,498 economic news articles from March 2005 to December 2023 were extracted from the Fars news agency website using a web crawling technique. Following initial preprocessing, the news texts were sorted into various categories via the Dirichlet Latent Allocation (LDA) model, wherein each category corresponds to a distinct news topic. Subsequently, to ascertain whether an article conveys a positive or negative sentiment, we executed lexicon-based sentiment analysis utilizing SentiStrength. Ultimately, by aggregating the news sentiment scores seasonally under each topic, we constructed a seasonal sentiment time series. These time series were then assessed for their efficacy in nowcasting Iran's quarterly GDP, employing ridge regression, lasso regression, elastic net, and gradient boosting methods. The findings reveal that incorporating textual data can reduce prediction errors by 12 to 18 percent relative to a univariate time series model. Moreover, our results suggest that sentiment extracted from textual content, particularly news articles, is a viable approach. This strategy could potentially enable the provision of immediate GDP estimates following the end of each reference quarter.