پیش بینی ریزش مشتریان بانک با استفاده از الگوریتم های یادگیری ماشین
منبع:
مطالعات راهبردی مالی و بانکی دوره ۳ تابستان ۱۴۰۴ شماره ۲
93 - 108
حوزههای تخصصی:
هدف: در صنعت بانکداری، حفظ مشتریان وفادار به مراتب کم هزینه تر و سودآورتر از جذب مشتریان جدید است. روی گردانی مشتریان به عنوان یکی از چالش های اصلی بانک ها، تاثیر مستقیمی بر کاهش سودآوری، افزایش هزینه های بازاریابی و افت سهم بازار دارد. پژوهش حاضر با هدف ارزیابی عملکرد الگوریتم های یادگیری ماشین در پیش بینی روی گردانی مشتریان شعب یک بانک دولتی در سال های 1400 تا 1403 انجام شده است. با توجه به اهمیت حفظ مشتریان وفادار و کاهش هزینه های ناشی از ریزش مشتریان، این مطالعه تلاش دارد مدلی کارآمد و تفسیرپذیر برای شناسایی مشتریان در معرض ریزش ارایه دهد.
روش شناسی پژوهش: مطالعه حاضر از نوع توصیفی-تحلیلی و گذشته نگر است. داده های مربوط به 2025 مشتری فعال طی دوره 1400 تا 1403 گردآوری شد. برای هر مشتری 12 ویژگی شامل مشخصات تراکنشی، رفتاری و جمعیت شناختی ثبت گردید. داده ها پس از پاک سازی، با استفاده از روش z-score نرمال سازی شدند. سپس با پیاده سازی الگوریتم های مختلف یادگیری ماشین شامل درخت تصمیم، جنگل تصادفی، ماشین بردار پشتیبان، شبکه عصبی پرسپترون چندلایه، شبکه بیزین و XGBoost در محیط R، عملکرد مدل ها با استفاده از روش اعتبارسنجی متقاطع 10تایی و بر مبنای معیارهای صحت، حساسیت و ویژگی مقایسه شد.
یافته ها: از بین 2025 مشتری بررسی شده، تعداد 325 نفر معادل %16 به عنوان مشتریان روی گردان شناسایی شدند. بررسی آماری نشان داد متغیرهای سن، مدت زمان رابطه با بانک و میانگین سپرده ها در 6 ماه گذشته بین دو گروه تفاوت معناداری ندارند. مدل XGBoost با صحت %89/96 حساسیت %11/87 و ویژگی %71/98 بالاترین عملکرد را نسبت به سایر الگوریتم ها نشان داد. همچنین سطح زیر منحنی نمودار مشخصه عملکرد برای این مدل برابر با 9907/0 محاسبه شد که بیانگر دقت بسیار بالا در طبقه بندی است.
اصالت/ارزش افزوده علمی: در این پژوهش ویژگی سازی (Feature Engineering) خاص بانکی انجام شده است. متغیرهای جدید از تراکنش ها یا رفتار مشتری استخراج شده که در مقالات مشابه کمتر استفاده شده است مانند تغییر تعداد تراکنش های سه ماهه چهارم به سه ماهه اول و ... ترکیب رویکردهای پیشرفته یادگیری ماشین و استفاده از داده های مربوط به مشتریان یکی از بانک های ایران ضرورت و اهمیت این پژوهش را بیشتر نمایان می سازد. همچنین این مطالعه یکی از معدود پژوهش هایی است که عملکرد چندین الگوریتم ML را در محیط بانکی ایران با بهره گیری از تحلیل تفسیرپذیر و اعتبارسنجی دقیق مقایسه می کند. نتایج آن می تواند به سیاست گذاران بانکی در طراحی اقدامات پیشگیرانه برای حفظ مشتریان کمک شایانی کند.