مطالب مرتبط با کلیدواژه
۲۱.
۲۲.
۲۳.
۲۴.
۲۵.
۲۶.
۲۷.
۲۸.
۲۹.
پردازش زبان طبیعی
منبع:
بازیابی دانش و نظام های معنایی سال نهم زمستان ۱۴۰۱ شماره ۳۳
197 - 262
پردازش زبان طبیعی به عنوان شاخه ای از زبان شناسی محاسباتی که تلاش عمده آن در جهت به کارگیری رایانه در فرآیند خودکارسازی درک و پردازش زبان طبیعی انسان و تمرکز بر تعامل میان انسان و رایانه است، در حوزه های مختلف علوم ازجمله علم اطلاعات و دانش شناسی، جایگاه مهمی یافته است. مطالعه حاضر باهدف اصلی شناسایی زیرشاخه ها و حوزه های فرعی علم اطلاعات و دانش شناسی که پردازش زبان طبیعی در آن ها مؤثر واقع شده است و به شیوه کتابخانه ای یا تحلیل اسنادی انجام پذیرفته است، این مطالعه ضمن اشاره به حوزه هایی ازعلم اطلاعات که پردازش زبان طبیعی در آن ها مفید واقع شده، به نقش کتابخانه های دیجیتال در عرصه علم اطلاعات و کاربرد پردازش زبان طبیعی در آن ها می پردازد. نتایج حاصل از این مطالعه نشان می دهد که پردازش زبان طبیعی در بسیاری از حوزه های فرعی و مرتبط با علم اطلاعات مانند بازیابی اطلاعات، کتاب سنجی، مدیریت اسناد و مدارک، استخراج خودکار اطلاعات، نمایه سازی خودکار، خلاصه سازی خودکار متون، طبقه بندی خودکار متون، نظام های پرسش و پاسخ و به کارگیری فناوری خطایاب املایی، ابهام زدایی از عبارات پرسش کاربران و پیش بینی واژه های موردنظر آن ها، تبدیل گفتار به متن و بالعکس و یاری رساندن به کاربران دارای معلولیت های جسمی مانند کم بینایان و نابینایان، نظر کاوی و تحلیل احساس واژگان مورداستفاده کاربران کتابخانه ها و مراکز اطلاع رسانی، قابل ردیابی است.
استخراج عملکرد محل از محتواهای متنی کاربرتولید با استفاده از روش های یادگیری ماشین(مقاله علمی وزارت علوم)
منبع:
اطلاعات جغرافیایی سپهر دوره ۳۱ زمستان ۱۴۰۱ شماره ۱۲۴
7 - 19
حوزههای تخصصی:
امروزه با افزایش روز افزون استفاده کاربران از شبکه های اجتماعی، اطلاعات مکانی مردم گستر رشد چشمگیری داشته است. از میان انواع اطلاعات، محتواهای متنی کاربرتولید غالباً در ساختار مشخصی به اشتراک گذاشته نمی شوند. یکی از ویژگی های عمده این نوع اطلاعات محل مبنا بودن آن ها است.محل های مورد گفت گوی بشر معمولاً همراه با ابهام و وابسته به بافت است. عملکرد محل یا به عبارتی عمده فعالیت هایی که افراد در یک محل انجام می دهند، به عنوان یک بافت در توصیفات محل، ازجمله ویژگی های عمده و متمایز کننده محل است. هدف این تحقیق استخراج عملکرد محل با استفاده از تحلیل محتواهای متنی کاربرتولید به اشتراک گذاشته شده توسط کاربران است. به این منظور ابتدا محل ها و نظرات کاربران در مورد محل ها در وبگاه TripAdvisorبه عنوان محتواهای متنی، جمع آوری شده، سپس از روش های مختلف پردازش زبان طبیعی به منظور آماده سازی و پیش پردازش داده ها استفاده می شود. در ادامه برای هر دیدگاه کاربر یک مجموعه واژگان با استفاده از مقادیر TF-IDFبه عنوان مقادیر بردار ویژگی ساخته می شود. سپس در یک روش نظارت شده این مقادیر به همراه عملکرد محل هابه عنوان ورودی به یک طبقه بندی کننده لجستیک رگرسیون به منظور آموزش مدل داده شده و با استفاده از آن عملکرد محل بر روی داده های آزمایشی پیش بینی شده است. نتایج ارزیابی روش از طریق محاسبه ماتریس درهم ریختگی نشان می دهد، صحت کلی روش پیشنهادی در حدود 96درصد است که رقم قابل توجهی است. همچنین بیشترین دقت و امتیاز F1 برای محل های سرو خوراکی است، درحالی که اقامتگاه ها به دلیل شباهت عملکردی به هتل ها کمترین دقت و امتیاز F1را دارند ولی با این وجود نتایج آن ها نیز قابل اطمینان و رضایت بخش است.
تبدیل متن محاوره ای به رسمی فارسی با استفاده از شبکه های عصبی مبتنی بر مبدل(مقاله علمی وزارت علوم)
حوزههای تخصصی:
در دنیای امروز شاهد رشد تولید داده های مختلف از جمله داده های متنی هستیم و همواره حجم زیادی از داده های متنی به روش های مختلف به خصوص در شبکه های اجتماعی تولید می شود. ولی این متن ها غالباً غیررسمی و دارای خطاهای بسیاری هستند که باعث می شود امکان استفاده از آن ها در بسیاری از پردازش های زبان طبیعی وجود نداشته باشد. در این مقاله به تبدیل متن محاوره ای به متن رسمی در زبان فارسی پرداخته شده است. برای این منظور دو مدل مختلف براساس مدل کدگذار-کدگشا و مدل مبدل که از به روزترین مدل های دنباله-به-دنباله هستند پیاده سازی شده اند. در کنار استفاده از مدل های شبکه عصبی، مجموعه ای از قواعد در تبدیل متن محاوره ای به رسمی فراهم شده اند و تأثیر استفاده از این قواعد در کنار هر یک از دو مدل بررسی شده است. در انتها نتایج مدل های گفته شده مقایسه شده اند که در بهترین حالت این نتایج به دست آمده به دقت ۷۰.۷ درصد در معیار بلوی ارتقاء یافته رسیده اند.
ترجمه ماشینی مبتنی بر مدل مبدل برای گویش های لری بویراحمدی و یزدی به فارسی معیار و گسترش منابع زبانی رایانشی مرتبط(مقاله علمی وزارت علوم)
منبع:
زبان و زبان شناسی دوره ۱۹ بهار و تابستان ۱۴۰۲ شماره ۳۷
153 - 172
حوزههای تخصصی:
با وجود تلاش های گسترده رایانشی بر روی گویش معیار فارسی، سایر لهجه ها و گویش ها و زبان های ایرانی کمتر مورد توجه محققین حوزه زبان شناسی رایانشی قرار گرفته اند. یکی از مهم ترین چالش های کار رایانشی بر روی این تمایز های زبانی، نبود یک مجموعه داده دیجیتال و استاندارد است. در این پژوهش اولین مجموعه داده تک زبانه و نیز داده موازی بر روی گویش های لری و یزدی که گویش هایی با منابع محدود محسوب می شوند، در مقابل فارسی معیار ارائه شده است. در ادامه مدل های یادگیری ژرف ترجمه ماشینی کدگذار-کدگشا در دو نوع مدل شبکه عصبی بازگشتی و مدل ژرف مبدل برای این گویش ها به فارسی معیار توسعه یافته و ارزیابی گردیده است. در این پژوهش که اولین تلاش محاسباتی روی این دو گویش محسوب می شود، برای ترجمه لری به فارسی و فارسی به لری به امتیاز BLEU به ترتیب ۳۹/7 و 29/3 رسیدیم. این امتیاز برای گویش یزدی به فارسی معیار و برعکس به 73/0 و 77/0 رسید. که نشان می دهند پژوهش های فراتری برای توسعه منابع زبانی برای این زبان نیاز است.
توسعه و بررسی ویژگی های روان سنجی نسخه فارسی تحقیق زبانی و شمارش کلمات (P-LIWC): طبقات هیجانات و فرآیندهای شناختی(مقاله علمی وزارت علوم)
منبع:
علوم روانشناختی دوره ۲۳ تابستان (مرداد) ۱۴۰۳ شماره ۱۳۷
997 - 1016
حوزههای تخصصی:
زمینه: تحقیق زبانی و شمارش کلمات به عنوان یک نمایشگر واژگان در متون شناخته می شود. به طور خاص، به کمک الگوریتم ها و فرآیندهای محاسباتی، می تواند عناصری مانند هیجانات، شناخت ها، نگرش ها، واژگان، سبک زبانی و ارتباطات اجتماعی را در متون تحلیل کند و نبود نسخه فارسی از مهم ترین دلایل انجام این پژوهش بود.
هدف: هدف از انجام این پژوهش توسعه و بررسی ویژگی های روان سنجی نسخه فارسی تحقیق زبانی و شمارش کلمات: طبقات هیجانات و فرآیندهای شناختی بود.
روش: روش پژوهش حاضر نوصیفی و همبستگی بود. روش توسعه طبقات فرآیندهای شناختی و هیجانات از چند مرحله تشکیل شده است. توسعه فرهنگ لغت با ترجمه اولیه کلمات نسخه اصلی انگلیسی در سال 1402 شروع شد و پس از آن برای به حداکثر رساندن پوشش دهی کلمات هر طبقه در زبان فارسی با استفاده از روش های تحلیل متن، پیکره عظیمی از متون فارسی مورد تجزیه وتحلیل قرار گرفت. در گام بعدی کلمات توسط داوران روانشناس مورد ارزیابی قرار گرفت و سپس برای کلمات تأیید شده لما آن ها توسط زبان شناسان به منظور تشخیص اشکال مختلف کلمه تعیین گردید. بعد از اتمام این مراحل به منظور بررسی پایایی فرهنگ لغت های فرآیندهای شناختی و هیجانات و زیر طبقات آن ها آلفای کرونباخ و کودر-ریچاردسون 20 محاسبه گردید و سپس برای بررسی روایی بیرونی، هم ارزی نسخه فارسی تحقیق زبانی و شمارش کلمات (P-LIWC) با نسخه اصلی انگلیسی LIWC-2022 مورد تجزیه وتحلیل قرار گرفت.
یافته ها: نتایج نشان داد همه طبقات هیجان ها و فرآیندهای شناختی در نسخه فارسی با نسخه نهایی انگلیسی LIWC-2022 دارای همبستگی معنادار بودند (0/01 >p) و این ابزار از روایی و پایایی مناسبی برخوردار است.
نتیجه گیری: با توجه به یافته های این پژوهش، می توان نتیجه گرفت که این نرم افزار در طیف گسترده ای از زمینه های پژوهشی و تجزیه وتحلیل متون فارسی کاربرد دارد و همچنین می توان در تحلیل متون جلسه درمان مراجعه کنندگان به کلینیک های روانشناسی نیز استفاده کرد
امکان سنجی قابلیت های هوش مصنوعی در تسریع فرایند استنباط احکام شرعی(مقاله علمی وزارت علوم)
منبع:
مطالعات فقه و اصول سال ۷ بهار و تابستان ۱۴۰۳ شماره ۱
274 - 250
حوزههای تخصصی:
امروزه یکی از مهم ترین موضوعات مستحدثه هوش مصنوعی است. هوش مصنوعی شاخه ای از علوم رایانه است که نوعی شبیه سازی هوش انسانی برای کامپیوتر است و هدف اصلی آن تولید ماشین های هوشمندی است که توانایی انجام وظایفی که نیازمند به هوش انسانی است را دارا باشد. هوش مصنوعی در بسیاری از عرصه ها از جمله فقه و استنباط ورود پیدا کرده و اثرگذار است. این مقاله با روش توصیفی تحلیلی واستفاده از منابع کتابخانه ای به تحلیل قابلیت های هوش مصنوعی در تسریع فرایند استنباط پرداخته و کاربردهای مختلف آن را بررسی می کند. در این تحقیق ابتدا به تحلیل تاثیرات هوش مصنوعی در گزارش پیامدها و تغییر مبانی اصولی و فقهی و سپس به بررسی نقش این فناوری در پیشگیری از خطاهای تطبیقی و ایجاد تعادل بین فن آوری و فقه پرداخته می شود. از دیگر موارد مطروحه می توان از جامع نگری و کیفی نگری در منابع فقهی، تصحیح درهم آمیختگی میان روش و محتوا و کشف بریدگی استدلالی در فرایند استنباط حکم شرعی نام برد. البته روش ها و تکنیک های مختلفی نیز برای دستیابی به این موارد معرفی می شود که می توان به سیستم های خبره، پردازش زبان طبیعی، یادگیری ماشین، شبکه های عصبی و یادگیری عمیق اشاره کرد. نتایج تحقیق نشان می دهد که استفاده از هوش مصنوعی می تواند به تسریع و تسهیل فرایند استنباط و ارتقای دقت و سرعت در این مسیر منجر شود.
تحلیل احساس و کاوش عقیده از متن به روش بدون نظارت با استفاده از منطق فازی: کاربرد در تحقیقات بازار(مقاله علمی وزارت علوم)
منبع:
تحقیقات بازاریابی نوین سال ۱۴ بهار ۱۴۰۳ شماره ۱ (پیاپی ۵۲)
127 - 146
حوزههای تخصصی:
تجزیه و تحلیل احساسات کاربران در حوزه بازاریابی و بهبود تجربه مشتریان نقشی اساسی دارد و به تدوین استراتژی های بازاریابی کمک می کند. این تحلیل یکی از عوامل اساسی در ارزیابی کارآیی و عملکرد رسانه های اجتماعی به عنوان ابزارهای ارتباطی است. پژوهش حاضر از لحاظ هدف، کاربردی، از لحاظ زمان، مقطعی، از لحاظ متغیر پژوهشی، کمّی و کیفی و از لحاظ طرح پژوهش، توصیفی است. محققان این پژوهش با بهره گیری از سیستم فازی و رویکرد بدون نظارت، بدون نیاز به دانش پیشین و داده های برچسب گذاری شده توییت های کاربران را دسته بندی کردند. این پیشرفت در تحلیل احساسات به محققان و صنعت گران امکان می دهد تا بدون نیاز به داده برچسب گذاری شده اطلاعات مفیدی را از نظر ها و احساسات کاربران در زمینه و بستر دلخواه خود استخراج و از آن در فرآیند تصمیم گیری های تجاری برای دستیابی به سود بیشتر استفاده کنند. محققان در پژوهش حاضر تجربه های کاربران را درباره تلفن های همراه شرکت های سامسونگ و اپل از سال 2022 تاکنون بررسی و تحلیل و آنها را به شکل مثبت، منفی و خنثی دسته بندی کردند. بدین منظور از سه ابزار تحلیل احساسات واژگان SentiWordNet، AFINN و VADER برای تعیین قطبیت توییت ها استفاده شد. نتایج دسته بندی نشان داد که میزان رضایت کاربران از تلفن های همراه شرکت سامسونگ نسبت به شرکت اپل بیشتر بوده است.
کاربرد هوش مصنوعی (یادگیری ماشینی) در روانشناسی یادگیری: رونمایی از بینش ها و جهت گیری های جدید(مقاله علمی وزارت علوم)
منبع:
علوم روانشناختی دوره ۲۳ پاییز (آذر) ۱۴۰۳ شماره ۱۴۱
۱۹۷-۱۷۹
حوزههای تخصصی:
زمینه: تلاقی هوش مصنوعی (AI)، روانشناسی و زبان شناسی کاربردی به ویژه در حوزه یادگیری زبان، مسیری جذاب را برای کاوش در فرآیندها و مکانیسم های پیچیده زیربنایی شناخت انسان باز کرده است. الگوریتم های یادگیری ماشینی این پتانسیل را دارند که اصول اساسی یادگیری زبان به ویژه درک مطلب را به عنوان متغیر اصلی یادگیری زبان روشن کنند ولی بررسی ادبیات این حوزه نشان داد تاکنون مطالعه ای به بررسی مهم ترین ویژگی های نحوی و واژگانی مؤثر بر درک مطلب زبان آموزان انگلیسی با تکنیک های یادگیری ماشین انجام نشده است. هدف: هدف پژوهش حاضر شناسایی مهم ترین ویژگی های نحوی و واژگانی مؤثر بر درک مطلب زبان آموزان انگلبسی با تکنیک های یادگیری ماشین نظارت شده بود. روش: طرح پژوهش حاضر از نوع علّی مقایسه ای بود. جامعه آماری در این مطالعه شامل همه دانش آموزان متوسطه دوم شهر تهران در سال 1402 بود که زبان انگلیسی را در مؤسسات آموزش زبان یاد می گیرند. از این میان با استفاده از روش نمونه گیری در دسترس 360 نفر از آن ها انتخاب شدند. ابزار گردآوری داده ها شامل آزمون BALA (یانگ، 2022) به صورت کتبی و گفتاری بود. برای تحلیل داده ها از الگوریتم های موجود در بسته نرم افزاری COVFEFE (کمیلی و سایرین، 2019) تحت نرم افزار Python استفاده شد. یافته ها: 260 ویژگی از متون کامپیوتری تهیه شده از پاسخ های گفتاری و نوشتاری زبان آموزان با استفاده از الگوریتم های پردازش زبان طبیعی (NLP) استخراج شد. سپس از مدل های یادگیری درخت تصمیم، نزدیک ترین همسایه، روش بردار پشتیبان، شبکه عصبی و روش خطی منظم برای پیش بینی درک مطلب با استفاده از ویژگی های زبانی استخراج شده استفاده شد. نتیجه گیری: نتایج نشان داد که تغییرات درک مطلب خواندن زبان آموزان را می توان با استفاده از ویژگی های دستوری و واژگانی استخراج شده به خوبی مدل سازی کرد. علاوه بر این، بیست ویژگی که بیشترین نقش را در تبیین واریانس دارند، شناسایی شد. این مطالعه نشان می دهد که روش های ML می توانند بررسی دقیق فرآیندهای زبانی مربوط به درک مطلب را تعیین کنند.
شناسایی پیشایندها و پسایندهای کاربرد دستیارهای هوشمند صوتی در تجهیزات دفاعی(مقاله علمی وزارت علوم)
منبع:
بهبود مدیریت سال ۱۸ زمستان ۱۴۰۳ شماره ۴ (پیاپی ۶۶)
34 - 58
حوزههای تخصصی:
دستیارهای هوشمند صوتی با توانایی درک زبان طبیعی، ارائه خدمات چندمنظوره، سهولت کاربرد، افزایش سرعت و کارایی تجهیزات را فراهم می سازند. هدف این پژوهش شناسایی پیشایندها و پسایندهای کاربرد دستیارهای هوشمند صوتی در تجهیزات نظامی آینده است. پژوهش حاضر از نوع آمیخته (مطالعه کیفی و سپس کمی) است. رویکرد کلی پژوهش کاربردی آینده نگر و از حیث شیوه گردآوری اطلاعات، اکتشافی است. در مطالعه کیفی با انجام مصاحبه با خبرگان تا اشباع نظری و استفاده از فن تحلیل محتوا جهت کدگذاری متن مصاحبه ها و استخراج پیشایندها و پسایندها انجام شده است. در مطالعه کمی از روش نقشه شناختی فازی برای تعیین عوامل محوری پیشایندی و پسایندی استفاده گردیده است. از منظر خبرگان پژوهش 18 عامل پیشایندی و 19 عامل پسایندی کاربرد دستیارهای هوشمند صوتی در تجهیزات نظامی آینده شناسایی گردید. مهم ترین عوامل پیشایندی شامل توسعه فناوری اینترنت اشیا، زیرساخت امنیتی و حفظ محرمانگی، پشتیبانی چندزبانه، دیجیتالی سازی تجهیزات است. مهم ترین عوامل پسایندی شامل نقض امنیت و محرمانگی، ایجاد ارتباط مؤثر در میدان نبرد، آگاهی محیطی بیشتر درصحنه نبرد و افزایش بهره وری عملیاتی است. گسترش به کارگیری تجهیزات هوشمند و کارایی عملیاتی آن ها، لزوم تحول در تولیدات دفاعی را گوشزد می کند. کاربرد دستیارهای هوشمند صوتی در تجهیزات نظامی با تسهیل تعامل کاربر، افزایش آگاهی محیطی از صحنه نبرد، و افزایش کارایی، این ابزارهای هوشمند را به بخش مهمی از تجهیزات دفاعی آینده تبدیل کرده است. الزامات محوری در کاربرد این ابزارها، دیجیتالی سازی، بومی سازی حساس ها، تولید رابط های صوتی هوشمند با پشتیبانی چندزبانه و تقویت روش های رمزنگاری است.