توسعه یک روش انتخاب مشخصه مبتنی بر نظریه اطلاعات و الگوریتم ژنتیک(مقاله علمی وزارت علوم)
حوزههای تخصصی:
هدف: در مواجهه با مجموعه داده های با ابعاد بالا، کاهش بُعد یک گام پیش پردازشی مهم برای حصول دقت بالا، کارایی و مقیاس پذیری در مسائل کلاسبندی است. هدف تحقیق حاضر ارائه یک روش انتخاب مشخصه در مواجهه با مجموعه داده های با ابعاد بالا، با استفاده از کاهش بُعد و الگوریتم ژنتیک است. روش: در این تحقیق یک الگوریتم ابتکاری توسعه یافته است که با استفاده از یک معیار جدید، اطلاعات متقابل بین ویژگی ها و کلاس هدف را مشخص می کند. در این روش مشخصه های جدید براساس ترکیب یا تبدیل مشخصه های اصلی تولید می شود و به این ترتیب فضای چند بُعدی، به فضایی جدید با ابعاد کمتر نگاشت پیدا می کند. همچنین علاوه بر در نظر گرفتن معیار جدید اطلاعات متقابل، از الگوریتم ژنتیک به منظور بهبود سرعت روش پیشنهادی استفاده شده است. یافته ها: عملکرد این روش بر روی مجموعه داده هایی با ابعاد مختلف، که تعداد مشخصه ها در آن ها از 13 تا 60 متفاوت بوده، ارزیابی شده است. ارزیابی روش پیشنهادی در مقایسه با روش های مشابه، از لحاظ دقت کلاسبند بررسی شده و نتایج نویدبخشی بدست آمد. نتیجه گیری: روش پیشنهادی با روش های MRMR, DISR, JMI, NJMIM در مجموعه داده های متفاوت اعمال شده است. متوسط دقت های به دست آمده از روش پیشنهادی 65.32، 74.51، 70.88 و 58.2 درصد می باشد، که حاکی از کارآمدی روش پیشنهادی است. طبق نتایج بدست آمده، به جز در مورد مجموعه داده sonar که نتیجه ای بهتر از روش پیشنهادی داشته است، متوسط عملکرد روش پیشنهادی بهتر از DISR, JMI, NJMIM و MRMR بوده است.