کاربرد یادگیری ماشین در جانهی داده های گمشده در مطالعات جمعیتی: مطالعه موردی جانهی سن مادر در ولادت های ثبت شده سال 1402(مقاله علمی وزارت علوم)
منبع:
جمعیت سال ۳۰ بهار ۱۴۰۲ شماره ۱۲۳
1 - 16
حوزههای تخصصی:
وجود داده های گمشده در مطالعات جمعیتی می تواند دقت تحلیل ها و نتایج را به طور قابل توجهی کاهش دهد. این پژوهش با هدف ارزیابی کارایی روش های مختلف جانهی داده های گمشده برای متغیر سن مادر در داده های ولادت سال 1402 انجام شده است. در این مطالعه، با در نظر گرفتن سازوکارها و نسبت های گمشدگی مختلف کارایی روش های سنتی و روش های مبتنی بر یادگیری ماشین بررسی شده است. نتایج این مطالعه نشان می دهد که روش های مبتنی بر یادگیری ماشین، به ویژه الگوریتم missForest، در کاهش خطای جانهی نسبت به روش های سنتی عملکرد بهتری دارند. با این حال، روش های سنتی مانند جانهی چندگانه با معادلات زنجیره ای نیز در شرایط خاص نتایج مطلوبی ارائه داده اند. کارایی هر روش به نوع داده ها، نسبت گمشدگی و همچنین سازوکار گمشدگی داده ها بستگی دارد. یافته های این پژوهش بر اهمیت انتخاب روش جانهی مناسب براساس الگوی گمشدگی و ویژگی های داده ها تأکید دارد.