مطالب مرتبط با کلیدواژه

همپوشانی واژگانی


۱.

فردوس-لکس: پیکره واژگانی از منابع آموزشی فارسی برای غیرفارسی زبانان(مقاله علمی وزارت علوم)

کلیدواژه‌ها: پیکره سطح بندی شده واژگان آموزش فارسی به غیرفارسی زبانان همپوشانی واژگانی ساخت پیکره واژگان ابزارهای رایانشی

حوزه‌های تخصصی:
تعداد بازدید : 0 تعداد دانلود : ۱
پژوهش حاضر با هدف تدوین پیکره ای مطابق با همپوشانی واژگانی در سطوح مبتدی، میانه و پیشرفتة منابع آموزش زبان فارسی به غیرفارسی زبانان در ایران، با رویکردی پیکره آگاه و روشی رایانشی انجام شد. این مطالعه در سه مرحله صورت گرفت. در مرحله اول، دادگان پژوهش شامل 14585 واحد واژگانی از 26 منبع آموزشی در سه سطح مبتدی، میانه و پیشرفته انتخاب شدند. این منابع شامل مجموعه کتاب های «پرفا»، «مینا»، «شیراز»، «پارسا»، «رسا»، «نگارا»، «خوانا» و «آموزش نوین زبان فارسی» بودند. سپس، تمامی واژگان به صورت دستی تایپ شده، به صورت رایانشی پیش پردازش شده، و برچسب اجزای کلام دریافت کردند. هنجارسازی به طور عمده با ابزار «دادماتولز» انجام پذیرفت. واحدسازی، بن واژه سازی و برچسب دهی اجزای کلام با استفاده از «استنزا» صورت پذیرفت. در مرحله دوم، با بهره گیری از برنامه نویسی «پایتون»، با کمک اجتماع و اشتراک بین مجموعه های واژگان هر کتاب، میزان همپوشانی واژگان در هر سطح و بین سطوح مختلف تعیین شد. در مرحله سوم، ماشین خوان کردن صورت پذیرفت؛ بدین صورت که یک پیکره با استاندارد نشانه گذاری XML توسعه داده شد که برای هر واژه در سطوح مختلف دارای حرف الفبا، واحد، بن واژه ، دامنه همپوشانی، برچسب اجزای کلام و فراداده کتاب های منبع آن است. نتایج پژوهش نشان داد که با افزایش سطح زبان آموزی، میزان همپوشانی واژگان روندی ثابت و سپس کاهشی دارد؛ به طوری که در سطوح مبتدی و میانه به ترتیب، در حدود ۳۶ درصد و 5/36 درصد همپوشانی مشاهده شد، اما در سطح پیشرفته این میزان به ۱۳ درصد کاهش یافته است. واکاوی اجزای کلام در هر سطح نشان داد که اسم ، فعل و صفت پرتکرارترین اجزای کلام در تمامی سطوح هستند. همچنین، در مقایسه همپوشانی واژگان بین سطوح مختلف (مبتدی و میانه، میانه و پیشرفته، مبتدی و پیشرفته) مقوله اسم بالاترین سهم را داشت. این یافته ها بر طراحی نظام مند منابع آموزشی جهت پیشرفت تدریجی مهارت های زبانی تأکید دارند.