مطالب مرتبط با کلیدواژه

خلاصه سازی خودکار (ماشینی)


۱.

مرور نظام مند مطالعات حوزه خلاصه سازی انتزاعی مبتنی بر پرس و جو(مقاله علمی وزارت علوم)

کلیدواژه‌ها: خلاصه سازی خودکار (ماشینی) خلاصه سازی مبتنی بر پرس وجو رویکرد انتزاعی مرور نظام مند پریزما

حوزه‌های تخصصی:
تعداد بازدید : ۴ تعداد دانلود : ۴
هدف: امروزه افراد به این حقیقت واقف اند که دانش قدرت است. لذا از بازیابی اطلاعات به سمت بازیابی دانش و کشف دانش سوق پیدا کرده اند. از طرفی، مطالعه حجم عظیم اسناد متنی وب، دسترس پذیری و کاربردپذیری دانش را برای آن ها دشوار نموده است. یکی از راهکارها جهت مواجهه با این مسئله، خلاصه سازی انتزاعی مبتنی بر پرس وجو است. خلاصه سازی انتزاعی مبتنی بر پرس وجو رویکردی سریع و کارآمد برای پیمایش متون است و یک حوزه پژوهشی بسیار پویا محسوب می شود. در این پژوهش با استفاده از مرور نظام مند، مطالعات پیرامون این حوزه شناسایی و تجزیه وتحلیل شده اند. روش: در پژوهش کاربردی حاضر با استفاده از دستورالعمل پریزما، یک مرور نظام مند انجام شده است. این دستورالعمل در قالب چهار گام شناسایی، غربالگری، شایستگی و شمول با استفاده از یک راهبرد جستجوی مناسب و بدون محدودیت زمانی در پایگاه های اسکوپوس، وب آوساینس، آی تریپل ای، پایگاه علمی کتابخانه دیجیتال ای سی ام، گوگل اسکالر، پروکوئست، نورمگز، مگیران، سید، سیویلیکا، علم نت و گنج اعمال شده است. درنهایت از 1714 مدرک شناسایی شده 31 مورد واجد شرایط بوده و مشمول مرور نظام مند شده اند. یافته ها: ماحصل مرور انجام شده نشان می دهد که مطالعات این حوزه قدمت چندانی ندارند و با سیر توأم صعودی و نزولی منتشر شده اند. اکثر این مطالعات از نوع مقاله منتشرشده در مجلات هستند. پژوهشگران برای سیستم های خلاصه سازی پیشنهادی بیشتر از رویکرد یک مرحله ای استفاده نموده اند و یادگیری های با نظارت و خودنظارتی بیشتر موردتوجه آن ها بوده است. همچنین، از روش های مبتنی بر قانون، آمار و یادگیری ماشین بهره گرفته اند. مدل های به کار گرفته شده مبتنی بر گراف، شبکه های عصبی و از پیش آموزش دیده است. نوع ورودی سیستم ها بیشتر تک سندی بوده و Debatepedia به عنوان محبوب ترین مجموعه داده شناسایی شده است. از میان هفده معیار ارزیابی ROUGE بیشترین کاربرد را داشته است. نتیجه گیری : بررسی ها نشان داد که چگونه هم افزایی های اتفاق افتاده در یادگیری، مدل ها، روش های مورداستفاده و معیارهای ارزیابی کاهش چالش هایی از قبیل عدم تناسب خلاصه تولیدشده با پرس و جو، عدم تناسب خلاصه تولیدشده با متن منبع، فقدان داده های برچسب گذاری شده برای آموزش مدل ها، افزونگی، مجموعه داده های محدود، فقدان مجموعه داده مخصوص این نوع خلاصه سازی، عدم وجود معیارهای ارزیابی بهبودیافته برای ارزیابی دقیق خلاصه های تولیدشده، ابهام معنایی ناشی از عدم تمایز بین جملات با معنای متفاوت و عدم رابطه هم ترازی بین توالی های ورودی و خروجی را به دنبال داشته است و درنهایت به بهبود عملکرد کلی سیستم های خلاصه سازی و توسعه آن ها کمک نموده است. اما، توانایی درک معنا در سیستم ها هنوز فاصله میان خلاصه های سیستمی و خلاصه های انسانی را پر نکرده است. زیرا معنای درک شده هنوز سطحی بوده و تا حدی وابستگی به ساختارهای نحوی در مدل ها دیده می شود. درواقع، توانایی درک معنا می تواند ضامن ایجاد سیستم هایی باشد که معنا و بینش های عمیق نهفته در متن را تشخیص داده و براساس وظیفه مشخص شده آن ها را در خروجی خود اعمال می کنند. بر این قرار، ارائه نوآوری هایی جهت رفع این ناکارآمدی به عنوان جهت های پژوهشی آینده پیشنهاد می شود. در این مسیر باید مدل سازی های معنایی و درک معنا در این سیستم های خلاصه سازی نهادینه شود که به اصلاح و پیشرفت مسیر تکامل روش شناسی های موجود کمک می نماید. همچنین، بهتر است با تغییر و تکامل منابع اطلاعاتی و تحولات درخواست های کاربران و زمینه های دانشی آن ها نیز همگام شد. افزون بر این، خلأ این سیستم ها در زبان های غیرانگلیسی احساس می شود. این امر با ایجاد و تقویت ابزارهای پردازش زبان طبیعی برای زبان های غیر انگلیسی قابلیت عملیاتی سازی دارد.