پیش بینی طول مدت بستری بیماران مبتلا به نارسایی قلبی با داده کاوی (مقاله پژوهشی وزارت بهداشت)
درجه علمی: علمی-پژوهشی (وزارت بهداشت)
آرشیو
چکیده
مقدمه: نارسایی احتقانی قلب یکی از چالش های اصلی نظام های سلامت در جهان است که با افزایش جمعیت سالمند، شیوع آن رو به افزایش است. پیش بینی دقیق طول مدت بستری بیماران مبتلا می تواند نقش مهمی در مدیریت بهینه منابع بیمارستانی، کاهش هزینه های درمان و ارتقای کیفیت مراقبت های پزشکی ایفا کند. این مطالعه با هدف ارائه مدل پیش بینی مبتنی بر داده کاوی جهت تخمین مدت بستری بیماران مبتلا به نارسایی احتقانی قلب و شناسایی عوامل کلیدی مؤثر بر آن انجام شد. روش ها: این پژوهش تحلیلی-کاربردی به صورت مقطعی بر روی داده های ۳۴۲۱ بیمار بستری در دو بیمارستان سیدالشهدا و آیت الله طالقانی ارومیه طی سال های ۱۳۹۷ تا ۱۳۹۹ انجام شد. داده های بیمارستان سیدالشهدا برای آموزش (۸۰٪) و آزمون مدل (۲۰٪)استفاده شد. طول مدت بستری با الگوریتم K-means خوشه بندی و به دو خوشه کوتاه مدت و بلندمدت تفکیک شد. الگوریتم های یادگیری ماشین شامل جنگل تصادفی، درخت تصمیم(C5.0)، شبکه عصبی مصنوعی و سیستم استنتاج عصبی-فازی تطبیقی (ANFIS) برای طبقه بندی مدت بستری استفاده شد. همچنین از روش های بیش نمونه گیری، کم نمونه گیری و و SMOTE برای متعادل سازی کلاس ها، اعتبارسنجی متقاطع 10 تایی برای پایایی مدل ها و الگوریتم اپریوری برای کشف قوانین همبستگی بین متغیرها استفاده شد. یافته ها: جنگل تصادفی با صحت 87/14٪، حساسیت 97/56٪ و AUC معادل 85/40٪ بهترین عملکرد را داشت. متغیرهایی مانند کراتینین بالا، هموگلوبین پایین، جنسیت مرد و بیماری های زمینه ای عوامل مؤثر بر مدت اقامت بودند. نتیجه گیری: مدل پیشنهادی می تواند ابزاری مؤثر برای طبقه بندی مدت بستری بیماران نارسایی احتقانی قلب و پشتیبان تصمیم گیری های مدیریتی و بالینی در بیمارستان ها باشد.Predicting the length of hospital stay in patients with congestive heart failure using data mining techniques
Introduction: Congestive heart failure (CHF) is a significant global challenge for healthcare systems, with its prevalence increasing due to an aging population. Accurate prediction of the length of stay (LOS) for CHF patients is critical for optimizing hospital resource management, reducing treatment costs, and improving the quality of medical care. This study aimed to develop a data mining-based predictive model to estimate the LOS of CHF patients and identify the most influential factors.
Methods: This cross-sectional study was conducted using the data of 3,421 CHF patients hospitalized at Seyed Al-Shohada and Ayatollah Taleghani hospitals in Urmia, Iran, between 2018 and 2020. Data from Seyed Al-Shohada Hospital were used for model training (80%) and testing (20%). The LOS was categorized into short-term and long-term classes using K-means clustering. Random forest, Decision tree (C5.0), Artificial neural network (ANN), and adaptive neuro-fuzzy inference system (ANFIS) were applied to classify LOS. Techniques such as oversampling, undersampling, and SMOTE were applied to balance the classes, and 10-fold cross-validation was used to ensure model reliability. The Apriori algorithm was also used to discover association rules.
Results: The random forest achieved the best performance with an accuracy of 87.14%, a sensitivity of 97.56%, and an AUC of 85.40%. Key predictors of LOS included elevated creatinine levels, low hemoglobin, male gender, and underlying comorbidities. The Apriori algorithm also revealed significant clinical and meaningful associations among variables.
Conclusion: The proposed model can serve as an effective tool for predicting LOS in CHF patients and support clinical and administrative decision-making in hospital settings.








