مطالب مرتبط با کلیدواژه

زبانشناسی رایانشی


۱.

مشکلات انطباق دسته های هم معنای فارس نت با دسته های هم معنای وردنت پرینستون(مقاله علمی وزارت علوم)

نویسنده:

کلیدواژه‌ها: شبکه واژگانی وردنت پرینستون فارس نت انطباق اولیه انطباق ثانویه زبانشناسی رایانشی

حوزه‌های تخصصی:
تعداد بازدید : ۱۴۸۰ تعداد دانلود : ۸۴۰
در این پژوهش به بررسی مشکلات موجود در انتخاب معادل برای دسته های هم معنای (دسمعناهای) فارس نت پرداخته شد. اهمیت این پژوهش به این لحاظ است که نتایج آن می تواند در طرحهای آینده مربوط به تکمیل فارس نت و ساخت شبکه های واژگانی دیگر یا تخصصی مورد استفاده قرار گیرد. با توجه به وجود سه دسته از مشکلات جهت انطباق وردنتها بر همدیگر شامل الف. مشکلات ناشی از سختی در تمایز معنایی در وردنت مبدأ ب. مشکلات ناشی از اصول حاکم بر وردنت مبدأ و منابع زبان مقصد و ج. مشکلات ناشی از تفاوتهای ذاتی بین زبان مبدأ و مقصد، به تحلیل موارد یافت شده در فارس نت پرداخته شده است. این پژوهش سعی بر پاسخ به سوالات زیر داشته است: مشکلات موجود بر سر راه انطباق دسمعناهای فارس نت با وردنت چه می باشد؟ چه مشکلاتی بسامد بیشتری دارند؟ آیا تفاوتی بین مشکلات موجود در انطباق فارس نت با وردنت و انطباق در سایر وردنتهای موجود وجود دارد؟ حجم نمونه مورد بررسی که به شکل تصادفی انتخاب شده اند 1552 دسته می باشد که شامل دسمعناهایی است که اولین عضو آن ها با حروف >ع، غ، ف و ق< شروع شده اند. مشکلات یافته شده به هشت دسته تقسیم گردیدند و بسامد و درصد هر مشکل ارائه گردید و برای حل برخی از این مشکلات راههایی پیشنهاد شد. این راه حلها می تواند در فرایند تکمیل فارس نت و یا پیش از ساخت شبکه های واژگانی دیگر یا شبکه های واژگانی تخصصی مد نظر قرار گیرد.
۲.

شناسایی و استخراج باهمایی های زبان فارسی با استفاده از روش های رایانشی(مقاله علمی وزارت علوم)

کلیدواژه‌ها: باهمایی پارسبرت حافظه کوتاه مدت ماندگار زبانشناسی رایانشی زبان فارسی

حوزه‌های تخصصی:
تعداد بازدید : ۲۴ تعداد دانلود : ۲۴
در این مقاله به بازشناسی باهمایی ها در زبان فارسی پرداخته می شود. پژوهش های صورت گرفته زبان فارسی در این زمینه عمدتاً آماری و مقابله ای بوده است. هدف این پژوهش بازشناسی باهمایی ها به روش پیکره بنیاد و رایانشی است. برای این منظور از پایگاه داده زبان فارسی به عنوان پیکره پژوهش استفاده شده است. همچنین به علت نداشتن لغت نامه باهمایی ها در زبان فارسی مجموعه داده ای از باهمایی بر اساس کتاب فرهنگ زبان آموز پیشرفته فارسی ساخته شده است. با استفاده از بردارهای تعبیه fasttext مدل زبانی با شبکه حافظه کوتاه مدت ماندگار آموزش داده می شود. همچنین با تنظیم دقیق «پارس برت» فراخوانی این مدل زبانی با استفاده از لیست های هزارتایی باهمایی ها و ناباهمایی ها محاسبه شد. در انتها، بررسی مقابله ای بازشناسی باهمایی در موتور ترجمه گوگل با استفاده از ترجمه هزار جمله فارسی به انگلیسی که هر یک از جملات دارای یک باهمایی است، انجام شد. نتایج نشان می دهد که مدل «پارس برت» با فراخوانی 93/95 درصد و 8/85 درصد به ترتیب، به بازشناسی باهمایی و ناباهمایی و مدل زبانی آموزش دیده با شبکه حافظه کوتاه مدت ماندگار به ترتیب باهمایی و ناباهمایی را با فراخوانی 6/6 درصد و 0 درصد بازشناسی کرد. همچنین بررسی مقابله ایِ دقت ترجمه موتور گوگل در ترجمه باهمایی ها سه نتیجه را در بر داشت: 1) باهمایی به درستی بازشناسی و ترجمه شد، 2) باهمایی به درستی بازشناسی نشد و ترجمه به صورت تحت اللفظی و واژه به واژه است، و 3) باهمایی بازشناسی نشد و ترجمه غلطی صورت پذیرفته است.