حمیدرضا برادران کاشانی

حمیدرضا برادران کاشانی

مطالب
ترتیب بر اساس: جدیدترینپربازدیدترین

فیلترهای جستجو: فیلتری انتخاب نشده است.
نمایش ۱ تا ۲ مورد از کل ۲ مورد.
۱.

مرور نظام مند مطالعات حوزه خلاصه سازی انتزاعی مبتنی بر پرس و جو(مقاله علمی وزارت علوم)

کلیدواژه‌ها: خلاصه سازی خودکار (ماشینی) خلاصه سازی مبتنی بر پرس وجو رویکرد انتزاعی مرور نظام مند پریزما

حوزه‌های تخصصی:
تعداد بازدید : ۳۲ تعداد دانلود : ۴۲
هدف: امروزه افراد به این حقیقت واقف اند که دانش قدرت است. لذا از بازیابی اطلاعات به سمت بازیابی دانش و کشف دانش سوق پیدا کرده اند. از طرفی، مطالعه حجم عظیم اسناد متنی وب، دسترس پذیری و کاربردپذیری دانش را برای آن ها دشوار نموده است. یکی از راهکارها جهت مواجهه با این مسئله، خلاصه سازی انتزاعی مبتنی بر پرس وجو است. خلاصه سازی انتزاعی مبتنی بر پرس وجو رویکردی سریع و کارآمد برای پیمایش متون است و یک حوزه پژوهشی بسیار پویا محسوب می شود. در این پژوهش با استفاده از مرور نظام مند، مطالعات پیرامون این حوزه شناسایی و تجزیه وتحلیل شده اند. روش: در پژوهش کاربردی حاضر با استفاده از دستورالعمل پریزما، یک مرور نظام مند انجام شده است. این دستورالعمل در قالب چهار گام شناسایی، غربالگری، شایستگی و شمول با استفاده از یک راهبرد جستجوی مناسب و بدون محدودیت زمانی در پایگاه های اسکوپوس، وب آوساینس، آی تریپل ای، پایگاه علمی کتابخانه دیجیتال ای سی ام، گوگل اسکالر، پروکوئست، نورمگز، مگیران، سید، سیویلیکا، علم نت و گنج اعمال شده است. درنهایت از 1714 مدرک شناسایی شده 31 مورد واجد شرایط بوده و مشمول مرور نظام مند شده اند. یافته ها: ماحصل مرور انجام شده نشان می دهد که مطالعات این حوزه قدمت چندانی ندارند و با سیر توأم صعودی و نزولی منتشر شده اند. اکثر این مطالعات از نوع مقاله منتشرشده در مجلات هستند. پژوهشگران برای سیستم های خلاصه سازی پیشنهادی بیشتر از رویکرد یک مرحله ای استفاده نموده اند و یادگیری های با نظارت و خودنظارتی بیشتر موردتوجه آن ها بوده است. همچنین، از روش های مبتنی بر قانون، آمار و یادگیری ماشین بهره گرفته اند. مدل های به کار گرفته شده مبتنی بر گراف، شبکه های عصبی و از پیش آموزش دیده است. نوع ورودی سیستم ها بیشتر تک سندی بوده و Debatepedia به عنوان محبوب ترین مجموعه داده شناسایی شده است. از میان هفده معیار ارزیابی ROUGE بیشترین کاربرد را داشته است. نتیجه گیری : بررسی ها نشان داد که چگونه هم افزایی های اتفاق افتاده در یادگیری، مدل ها، روش های مورداستفاده و معیارهای ارزیابی کاهش چالش هایی از قبیل عدم تناسب خلاصه تولیدشده با پرس و جو، عدم تناسب خلاصه تولیدشده با متن منبع، فقدان داده های برچسب گذاری شده برای آموزش مدل ها، افزونگی، مجموعه داده های محدود، فقدان مجموعه داده مخصوص این نوع خلاصه سازی، عدم وجود معیارهای ارزیابی بهبودیافته برای ارزیابی دقیق خلاصه های تولیدشده، ابهام معنایی ناشی از عدم تمایز بین جملات با معنای متفاوت و عدم رابطه هم ترازی بین توالی های ورودی و خروجی را به دنبال داشته است و درنهایت به بهبود عملکرد کلی سیستم های خلاصه سازی و توسعه آن ها کمک نموده است. اما، توانایی درک معنا در سیستم ها هنوز فاصله میان خلاصه های سیستمی و خلاصه های انسانی را پر نکرده است. زیرا معنای درک شده هنوز سطحی بوده و تا حدی وابستگی به ساختارهای نحوی در مدل ها دیده می شود. درواقع، توانایی درک معنا می تواند ضامن ایجاد سیستم هایی باشد که معنا و بینش های عمیق نهفته در متن را تشخیص داده و براساس وظیفه مشخص شده آن ها را در خروجی خود اعمال می کنند. بر این قرار، ارائه نوآوری هایی جهت رفع این ناکارآمدی به عنوان جهت های پژوهشی آینده پیشنهاد می شود. در این مسیر باید مدل سازی های معنایی و درک معنا در این سیستم های خلاصه سازی نهادینه شود که به اصلاح و پیشرفت مسیر تکامل روش شناسی های موجود کمک می نماید. همچنین، بهتر است با تغییر و تکامل منابع اطلاعاتی و تحولات درخواست های کاربران و زمینه های دانشی آن ها نیز همگام شد. افزون بر این، خلأ این سیستم ها در زبان های غیرانگلیسی احساس می شود. این امر با ایجاد و تقویت ابزارهای پردازش زبان طبیعی برای زبان های غیر انگلیسی قابلیت عملیاتی سازی دارد.
۲.

بررسی نقش هستی شناسی و نمودار دانش در طبقه بندی اسناد متنی: مروری بر مطالعات(مقاله علمی وزارت علوم)

کلیدواژه‌ها: طبقه بندی خودکار اسناد متنی نمودار دانش هستی شناسی دانش دامنه

حوزه‌های تخصصی:
تعداد بازدید : ۲۶۰ تعداد دانلود : ۲۱۶
 هدف: باتوجه به افزایش نرخ استفاده از اینترنت و افزایش حجم اسناد الکترونیکی قابل مشاهده در وب، طبقه بندی خودکار متن تبدیل به یکی از روش های کلیدی برای ارتقای بازیابی اطلاعات و مدیریت دانش مجموعه های متنی دیجیتالی شده است. افراد با طبقه بندی متون می توانند اطلاعات موردنیاز خود را با دقت بیشتر و سرعت بالاتر جستجو و بازیابی کنند. آن چیزی که در بحث طبقه بندی خودکار اسناد حائز اهمیت است، برچسب گذاری اسناد به کلاس های از پیش تعریف شده است، به گونه ای که اسنادی که در یک طبقه جای می گیرند بیشترین شباهت و با اسناد سایر طبقه ها بیشترین تفاوت را داشته باشند و قابلیت استفاده از روابط معنایی را داشته باشد. در ای ن راس تا، پژوه ش حاض ر به بررسی نقش هستی شناسی و نمودار دانش در طبقه بندی خودکار اسناد متنی می پردازد.روش: این مطالعه به مرور پژوهش ها و اسناد مرتبط با کاربرد ابزارهای معنایی مانند هستی شناسی ها و نمودار دانش در طبقه بندی اسناد متنی پرداخته است. به منظور جمع آوری متون، سه پایگاه اطلاعاتی داخلی شامل «بانک اطلاعات نشریات کشور»، «پایگاه مرکز اطلاعات علمی جهاد دانشگاهی» و «مرجع دانش» و سه پایگاه استنادی خارجی یعنی «وب آو ساینس»، «اسکوپوس» و «گوگل اسکالر» بدون درنظرگرفتن بازه زمانی در هر دو دسته بررسی شده است. یافته ها: نتایج واکاوی متون نشان داد در مدل فضای برداری ارتباط معنایی بین کلمات در نظر گرفته نمی شود و ترتیب کلمات در جملات از بین می رود. با نادیده گرفتن روابط معنایی و نحوی مختلف بین کلمات در زبان طبیعی، بازنمایی متفاوتی از اسناد فراهم می شود؛ اما هستی شناسی ها و نمودار دانش با دریافت معنای موجودیت ها و کلاس ها به تقویت مدل های یادگیری ماشینی کمک می نمایند. استفاده از این ابزارها به عنوان یک مرجع خارجی در حین فرایند طبقه بندی عمل می کند و دانش زمینه را برای مدل های طبقه بندی فراهم می نماید. به طورکلی استفاده از این ابزارها به ماشینن ها اجازه می دهند معنای داده هایی را که با آن ها کار می کنند، درک کنند.نتیجه گیری: کاربست هستی شناسی ها و نمودار دانش در طبقه بندی اسناد متنی می تواند موجب تقویت نتایج الگوریتم های یادگیری ماشین از طریق بهره برداری از دانش زمینه شود. این ابزارها می تواند معانی کلمات را از جملات دارای ابهام آزاد نموده و مشکلات مرتبط با زبان طبیعی را حل کند. استفاده از هستی شناسی و نمودار دانش می تواند به طور مؤثری در طبقه بندی اسناد متنی کمک کند و باعث ارتقای دقت و کارایی مدل های طبقه بندی شود؛ اما ساخت و ادغام هستی شناسی و نمودار دانش امری خسته کننده، زمان بر و پیچیده است که امکان پذیری و ارزش عملی آن ها را محدود می کند. در زبان فارسی علاوه بر مشکل مطرح شده در به کارگیری هستی شناسی ها و نمودار دانش در طبقه بندی اسناد، محدودیت هایی مانند ویژگی های خاص زبان فارسی در نگارش و محدودیت فنی وجود دارد؛ لذا استفاده از هستی شناسی و نمودارهای دانش عمومی و یا دامنه در بحث طبقه بندی اسناد نیازمند توجه به این محدودیت ها و پیچیدگی های فنی است و علاوه بر این مستلزم توسعه و تلاش های بیشتری بالأخص در زبان فارسی است.

پالایش نتایج جستجو

تعداد نتایج در یک صفحه:

درجه علمی

مجله

سال

حوزه تخصصی

زبان