پیش بینی تعهدهای آتی شرکت های بیمه با استفاده از مدل حافظه بلندمدت -کوتاه مدت (مقاله علمی وزارت علوم)
درجه علمی: نشریه علمی (وزارت علوم)
آرشیو
چکیده
هدف: این پژوهش به دنبال ارائه مدلی برای محاسبه تعهدهای آتی شرکت های بیمه است تا به چالش های بالقوه موجود در روش سنتی پاسخ مناسبی دهد. به صورت سنتی، شرکت های بیمه از روش زنجیره نردبانی، به عنوان نوعی ابزار آماری، برای پیش بینی روند توسعه خسارت ها استفاده می کنند. این روش آماری به دلیل سادگی فرضیه ها و تفسیر روشن، تأیید نهادهای نظارتی در کشورهای مختلف را نیز به همراه دارد. با این حال، وجود فرضیه هایی نظیر ایستایی در ساختار توسعه داده ها و ارتباط خطی بین متغیرها، ممکن است کارایی مدل را در مواجهه با تغییرات ناشی از عوامل داخل و خارج از سازمان، مانند اِعمال سیاست های داخلی یا عوامل خارجی مانند همه گیری کووید۱۹ متأثر سازد. محاسبه نزدیک به واقعیت تعهدهای شرکت های بیمه با توانگری مالی آن ها ارتباط تنگاتنگی دارد. مبلغی که شرکت های بیمه برای پاسخ به تعهدهای آتی خود تخصیص می دهند، به عنوان ذخیره شناسایی می شود. محاسبه ذخایر کمتر از تعهدهای آتی، شرکت بیمه را در ایفای تعهدهایش دچار مشکل می کند و از سویی دیگر، محاسبه بیش از مبلغ مورد نیاز، صورت های مالی شرکت های بیمه را تحت تأثیر قرار می دهد.روش: مدل ارائه شده در این پژوهش با استفاده از یادگیری ماشین و هوش مصنوعی، تعداد حوادث روزانه با خسارت های جانی را در بخش بیمه شخص ثالث پیش بینی می کند. خروجی این مدل، یعنی ترکیب تعداد و زمان وقوع حوادث، در محاسبه تعهدهای آتی و ذخیره خسارت در این بخش بیمه ای نقش کلیدی دارد. این مدل با کمک داده های تاریخی خسارت بیمه گذاران شرکت بیمه کارآفرین، در بخش بیمه شخص ثالث آموزش دیده است. این مدل قادر است لایه های پنهان و ارتباطات غیرخطی و پیچیده بین داده های خسارتی را شناسایی کند. در این پژوهش، از الگوریتم شبکه عصبی با حافظه بلندمدت کوتاه مدت که در سری های زمانی توانایی پیش بینی بیشتری دارد، استفاده شده است. داده های تاریخی مربوط به خسارت های جرحی بیمه گذاران، در بازه زمانی فروردین ۱۳۹۶ تا شهریور ۱۴۰۰ بوده است.یافته ها: کارایی مدل با بهینه سازی ابرپارامترها ارتباط نزدیک دارد. برای بهینه سازی مدل دو رویکرد، یعنی جست وجوی شبکه ای و تصادفی برای شناسایی ابرپارامترها با یکدیگر مقایسه شده اند. میانگین مربعات خطا به عنوان شاخص سنجش عملکرد در نظر گرفته شده است. این شاخص برای داده های آموزش، در هر دو مدل با فاصله کمی از یکدیگر (33/16 در مقابل 4/17) برتری جست وجوی شبکه ای را نشان می دهد؛ اما در این روش، نتیجه داده های آزمون از داده های آموزش بهتر بود (22/15 در برابر 33/16) که این امر می تواند نشانه ای از وقوع بیش پردازش باشد.نتیجه گیری: این مقاله برای طراحی مدل پیش بینی تعداد روزانه حوادث با خسارت های جانی، استفاده از روش جست وجوی تصادفی را برای تنظیم ابرپارامترهای مدل طراحی شده بر مبنای شبکه عصبی حافظه بلندمدت کوتاه مدت پیشنهاد می کند؛ زیرا مدل طراحی شده بر این مبنا، بر مشکل بیش پردازش غلبه می کند و می تواند در کار با داده های ناآشنا عملکرد مناسبی داشته باشد. بیش پردازش زمانی رخ می دهد که مدل بیش از حد از داده های آموزشی تأثیر بگیرد و نه تنها الگوهای واقعی را یاد بگیرد، بلکه نویزها و جزئیات جزئی داده ها را نیز یاد بگیرد. این ممکن است باعث کاهش جامع پذیری مدل شود.Forecasting Insurance Company Commitments with Long Short-Term Memory Models
ObjectiveThis study aims to present a novel model for predicting the future commitments of insurance companies that can adequately address the potential challenges of traditional methods. Traditionally, insurance companies use the Chain Ladder approach as a statistical tool to forecast the trend of claims development. This statistical method is favored by regulatory authorities in various countries due to its simplicity in assumptions and clear interpretation. However, certain assumptions, such as the stability of data development and linear relationships between variables, can affect the efficiency of this model when faced with internal policies or external factors like the COVID-19 pandemic. Forecasting future commitments close to reality is closely related to the financial stability of insurance companies. The amount that insurance companies allocate to meet their future obligations is identified as reserves. Calculating reserves that are less than the required amounts can pose challenges for insurance companies in fulfilling their commitments while calculating more than necessary amounts can negatively impact the financial statements of insurance companies. MethodsIn this study, a dynamic model based on machine learning algorithms is proposed. The model's output, which combines the number and timing of bodily injury accidents, plays a crucial role in calculating reserves for non-life insurance products. This model is specifically trained to predict the frequency of accidents in Vehicle Third-Party Liability Insurance. It can identify hidden patterns and non-linear, complex relationships within claims data. A Long Short-Term Memory (LSTM) neural network algorithm is employed, recognized for its strong predictive capability in time series data. The model is trained using historical data from Karafarin Insurance Company covering the years 2017 to 2021. ResultsThe performance of the model is highly related to the hyperparameters chosen for the model. Two of the most common approaches for tuning the hyperparameters are tested in this study. These Two models are grid and random search. The Root Mean Square Error (RMSE) is used as a performance metric, and it indicates that the grid search has a lower RMSE than the random search for the training data with a slight difference (16.33 versus 17.4). However, the results for the test data in the grid search have a sign of overfitting. ConclusionThis study recommends using random search for tuning the hyperparameters of the model to predict the frequency of daily incidents. The evaluation of the two approaches for tuning hyperparameters indicates that random search is more suitable for working with unfamiliar data and managing overfitting situations. Overfitting occurs when the model becomes overly influenced by the training data, learning not only the actual patterns but also the noise and minor details of the data. This issue can negatively impact the model's generalization ability.