مجتبی مازوچی

مجتبی مازوچی

مطالب
ترتیب بر اساس: جدیدترینپربازدیدترین

فیلترهای جستجو: فیلتری انتخاب نشده است.
نمایش ۱ تا ۶ مورد از کل ۶ مورد.
۱.

روشی برای بازیابی اطلاعات از داده های گم شده با استفاده از تکنیک های داده کاوی و الگوریتم ژنتیک(مقاله علمی وزارت علوم)

کلیدواژه‌ها: بازیابی اطلاعات داده های گم شده داده کاوی الگوریتم ژنتیک خوشه بندی مدل رگرسیون

حوزه‌های تخصصی:
تعداد بازدید : ۵ تعداد دانلود : ۶
هدف: در ادبیات آماری، اصطلاحات مختلف و غالباً مترادفی برای مفهوم داده های گم شده وجود دارد. این اصطلاحات عبارتند از داده های گم شده، داده های از دست رفته، داده های ناقص و داده های بی پاسخ. در آمار، داده های گم شده یا مقدارهای گم شده زمانی رخ می دهد که هیچ مقدار داده ای برای یک متغیر در یک مشاهده ذخیره نشده باشد. داده ها اغلب در تحقیقات اقتصادی، جامعه شناسی و علوم سیاسی از بین می روند، زیرا دولت یا نهادهای خصوصی ممکن است گزارش های حساس را ناقص ارائه دهند، یا ممکن است برخی از افراد شرکت کننده در مطالعه از ادامه همکاری انصراف دهند، یا از پاسخ دادن به برخی از سوالات اجتناب کنند، یا محققین، تکنسین ها و جمع آوری کننده داده ها ممکن است اشتباهاتی را انجام دهند که منجر به گم شدن داده ها شود. داده های گم شده می توانند باعث ایجاد اغتشاش در توزیع متغیر شوند، یعنی می توانند باعث بیش برازش یا کم برازش مدل ها شوند. داده های گم شده می توانند باعث یک سوگیری (اریبی) در مجموعه داده شوند و بنابراین تجزیه و تحلیل آماری را به سوی نتایج اریب سوق داده و نهایتاً دستیابی به یک نتیجه گیری مفید از داده های جمع آوری شده را با مشکل مواجه می سازد و می توانند منجر به تجزیه وتحلیل نادرست مدل شوند. پیش از این، برای غلبه بر مشکل داده های گم شده مرسوم ترین روش، حذف داده های گم شده بود که منجر به داده هایی با کیفیت پایین و به تبع آن تحلیل و استخراج نتایج دارای سوگیری می شد. امروزه با پیشرفت های علمی در حوزه های گوناگون و پیدایش روش های توانمند آماری، می توان پیش از مد ل سازی داده های ناکامل، مقادیر گم شده را با مقادیر مناسب جایگذاری یا برآورد کرد. با توجه به اهمیت ذکر شده موضوع مواجهه و مدیریت داده های گم شده، پژوهش حاضر با هدف ارائه روشی به منظور بهبود دقت بازیابی اطلاعات و دانش از داده های گم شده انجام شده است. روش: در روش پیشنهادی از تکنیک های داده کاوی شامل خوشه بندی و رگرسیون، و همچنین از الگوریتم های هیوریستیک شامل الگوریتم ژنتیک استفاده شده است. در روش های موجود، برای جایگزینی داده از دست رفته، از کل مجموعه داده استفاده می شود. این موضوع سبب در نظر گرفتن رکوردهای غیر مشابه رکورد مربوط به داده از دست رفته خواهد شد. لذا منجر به نتایج اشتباه خواهد شد. در الگوریتم پیشنهادی، از خوشه بندی به منظور شناسایی رکوردهای مشابه استفاده شده است. سپس، برای هر خوشه، میزان داده های گم شده هر صفت (ستون) از مجموعه داده مورد محاسبه قرار گرفته است. بر اساس میزان داده از دست رفته، از مدل رگرسیون یا از الگوریتم ژنتیک به منظور بازیابی اطلاعات از دست رفته استفاده شده است. یافته ها: نتایج پیاده سازی روش پیشنهادی بر روی یک مجموعه داده که حاوی داده های گم شده به صورت تصادفی بودند نشان داد میزان خطای الگوریتم پیشنهادی برابر 27 درصد است که نسبت به روش استفاده از میانگین، میانه و مد که دارای خطای 56.5 درصد، و روش استفاده از رگرسیون که دارای خطای 34.6 درصد، و روش ماشین بردار پشتیبان (SVM) که دارای خطای 42.1 درصد بود، دقت بالاتری در جانهی داده های گم شده داشته است. نتیجه گیری: در روش های موجود، برای جایگزینی داده از دست رفته، از کل مجموعه داده استفاده می شود. این موضوع سبب در نظر گرفتن رکوردهای غیر مشابه رکورد مربوط به داده از دست رفته خواهد شد. لذا منجر به نتایج اشتباه خواهد شد. در الگوریتم پیشنهادی، از خوشه بندی به منظور شناسایی رکوردهای مشابه، و محاسبه داده از دست رفته بر اساس رکوردهای مشابه موجود در خوشه، استفاده شده است. همچنین، در الگوریتم پیشنهادی، حذف داده های پرت، تعیین تعداد خوشه های بهینه و غیره در نظر گرفته شده است. این موضوع سبب خواهد شد، داده های غیر عادی تاثیری در محاسبه داده های از دست رفته نداشته باشند. در الگوریتم پیشنهادی، برای هر خوشه، صفاتی (ستون ها) که بیش از یک سوم داده از دست رفته دارند حذف می شوند. این موضوع سبب جلوگیری از تاثیر داده های غیر قابل اطمینان در محاسبه داده های از دست رفته خواهد شد. همچنین، از مدل رگرسیون در خوشه استفاده می شود که سبب می شود در محاسبه داده های از دست رفته، فیلدهای مربوط در صفات (ستون های) دیگر نیز در نظر گرفته شود. استفاده از الگوریتم ژنتیک در روش پیشنهادی، که منجر به استفاده تلفیقی از میانگین، میانه، مد و مدل رگرسیون می شود، سبب دستیابی به نتایج قابل قبول تری خواهد شد. کلیدواژه ها: بازیابی اطلاعات، داده های گم شده، داده کاوی، الگوریتم ژنتیک، خوشه بندی، مدل رگرسیون.
۲.

طراحی و اعتبارسنجی مدلی جهت ارزیابی وضعیت داده باز نهادهای دولتی ایران(مقاله علمی وزارت علوم)

کلیدواژه‌ها: تکنیک تصمیم گیری چند معیاره تکنیک بهترین-بدترین شاخص داده باز شفافیت داده باز نهادهای دولتی وزارتخانه ها

حوزه‌های تخصصی:
تعداد بازدید : ۱۲ تعداد دانلود : ۱
هدف: داده های باز به داده های غیرمحرمانه گفته می شود که بدون هیچ محدودیتی در استفاده یا توزیع، در دسترس قرار می گیرند. داده های دولتی باز ابزاری برای توانمندسازی شهروندان و دادن دسترسی و مجوز به آن ها برای استفاده از داده های تولید شده توسط بخش دولتی است، به طوری که آن ها می توانند از داده ها استفاده کنند، ذخیره نمایند، توزیع مجدد کنند و آن ها را با سایر منابع داده ادغام نمایند. ارائه اطلاعات به صورت داده باز، کاهش فساد، کسب اعتماد عمومی و ایجاد جامعه مردم سالار را درپی دارد. همچنین داده های باز امکان بیشتری برای پایش فعالیت های حاکمیتی فراهم می کند. متأسفانه علی رغم اهمیت موضوع و وجود الزامات قانونی، هنوز هیچ مدل قابل استنادی جهت ارزیابی وضعیت داده باز نهادهای دولتی ایران ارائه نگردیده است. این پژوهش با هدف طراحی و اعتبارسنجی مدلی جهت ارزیابی وضعیت داده باز نهادهای دولتی ایران با تمرکز بر محورهای عمومی، جهت پیشبرد اهداف مرتبط با شفافیت نهادها و سازمان های حاکمیتی انجام شده است. روش: روش پژوهش به لحاظ هدف، کاربردی و همچنین، به لحاظ نوع داده ها، از نوع ترکیبی (کیفی/ کمّی) است. برای شناسایی گویه های ارزیابی شاخص داده باز از سه منبع اطلاعاتی استفاده شده است. در ابتدا مبانی نظری و پژوهش های انجام شده در این حیطه بررسی و گویه های پیشنهاد شده توسط صاحب نظران استخراج گردید. در ادامه، با استفاده از روش نمونه گیری هدفمند و گلوله برفی، نخبگان و مطّلعان حوزه انتخاب شده و با آن ها مصاحبه های عمیقِ نیمه ساختاریافته تا رسیدن به اشباع نظری در مورد گویه ها، انجام گرفت. منبع اطلاعاتی سوم نیز، مصوبه شماره (1) جلسه شانزدهم شورای اجرایی فناوری اطلاعات ایران بوده است که با هدف ارتقای شفافیت و دسترسی آزاد شهروندان به داده های باز دستگاه های اجرایی مطرح شده و مطابق آن کلیه دستگاه های اجرایی ملزم به انتشار داده های خود در 12 دسته هستند. پس از شناسایی و ترکیب گویه های مشابه و وزن دهی آن ها، مدل اولیه بدست آمد. به منظور تحلیل روایی گویه های مدل اولیه از شاخص روایی محتوا (CVI) استفاده شده است. در نهایت نیز برای صحت سنجی مدل اولیه از مدل سازی معادلات ساختاری و آزمون های آماری مرتبط استفاده شده و نهایی سازی مدل انجام شد. یافته ها: بررسی سه منبع اطلاعاتی ذکر شده که جهت شناسایی شاخص های ارزیابی داده دولتی باز مورد استفاده قرار گرفتند، به شناسایی 33 شاخص در قالب چهار بُعد مختلف اطلاعات پایه ای، اطلاعات مالی، مشارکت پذیری و نظام حقوقی و عملکردی منجر شد. در ادامه پس از بررسی روایی، پایایی و صحت سنجی مدل اولیه، 29 شاخص در قالب چهار بُعد ذکر شده، جهت ارزیابی داده دولتی باز مورد تایید قرار گرفتند. نتایج روش بهترین- بدترین که جهت اولویت بندی ابعاد از لحاظ اهمیت مورد استفاده قرار گرفته نیز نشان داد، ابعاد اطلاعات مالی با وزن %08/51، نظام حقوقی و عملکردی با وزن %57/23، مشارکت پذیری با وزن %42/18و اطلاعات پایه ای با وزن %94/6 به ترتیب مهم ترین تا کم اهمیت ترین ابعاد در ارزیابی داده دولتی باز هستند. نتیجه گیری: یافته های پژوهش حاضر پتانسیل لازم جهت تسهیل فرآیند ارزیابی صحیح داده دولتی باز از طریق توجه به شاخص ها و ابعاد مرتبط را دارد. یافته ها می تواند به مسئولین، پژوهشگران و عموم مردم کمک نماید تا با در نظر گرفتن شاخص های ارزیابی ذکر شده، ارزیابی مناسبی از سازمان ها و یا موسسات دولتی داشته باشند تا متعاقباً پیامدهای مثبت داده دولتی باز در جامعه نمایان شود.  
۳.

سازوکارهای حکمرانی مشارکتی و مردمی با استفاده از داده های دولتی باز(مقاله علمی وزارت علوم)

تعداد بازدید : ۱۰۹ تعداد دانلود : ۱۰۱
حکمرانی مشارکتی و همکاری بین حکومت و مردم، سبب دستیابی به منابع انسانی و ایده های شهروندان، تصمیم گیری های آگاهانه تر، کاهش فساد و هدررفت بودجه و غیره خواهد شد و درنتیجه حکومت مردم سالار به وجود می آید. با توجه به ضرورت بیان شده، هدف این پژوهش بررسی روش های افزایش مشارکت سازمان های دولتی در ارائه داده ها به صورت باز یعنی داده هایی که آزاد و رایگان در اختیار مردم قرار می گیرد و همچنین بررسی روش های افزایش مشارکت شهروندان در استفاده از داده ها است. بدین منظور، از مطالعات کتابخانه ای برای استخراج معیارهای تأثیرگذار در افزایش تمایل شهروندان در استفاده از داده ها و استخراج عوامل و محرک ها در ترغیب سازمان های دولتی در ارائه داده ها به صورت باز استفاده شده است. سپس، تمامی سازمان ها و مؤسسه های دولتی حاضر در سامانه ملی کاتالوگ و مجموعه داده های باز و کاربردی که به ارائه داده ها به صورت باز می پردازند مورد بررسی قرار گرفته اند و وضعیت هر سازمان با توجه به هر معیار استخراج و مشخص شده است. سپس با روش داده کاوی، ویژگی های داده های سازمان هایی که مورد تمایل و استفاده بیشتر شهروندان بوده مشخص شده است. همچنین با استفاده از روش میدانی و تکنیک های تصمیم گیری چندمعیاره، وزن و اهمیت عوامل تأثیرگذار در مشارکت سازمان ها در ارائه داده ها به صورت باز محاسبه شده است. پس از مطالعات کتابخانه ای، معیار های «اصالت داده ها»، «باز بودن مجوز»، «به روز بودن»، «میزان دسترسی به داده»، «کامل بودن فراداده»، «تعداد مجموعه داده»، «باز بودن قالب»، «تبعیض آمیز نبودن»، «قابل فهم بودن»، «تعداد دسته های داده»، «رایگان بودن»، «عدم داده های از دست رفته»، «امکان درخواست داده»، «تجسمی بودن»، «بازخوردپذیر» و «موضوع مجموعه داده» به عنوان معیارهای جامع تأثیرگذار در افزایش تمایل شهروندان در استفاده از داده ها استخراج شدند. براساس نتایج به دست آمده، معیار «موضوع جامعه» با دارا بودن ضریب 72/564 و علامت مثبت، بیشترین تأثیر را در افزایش میزان بازدید شهروندان از داده های دولتی باز داشت. پس از آن، معیار «باز بودن قالب» با دارا بودن ضریب 52/682 و علامت مثبت، رتبه دوم را در افزایش میزان بازدید داشته است. همچنین، براساس مطالعات کتابخانه ای، 6 عامل «نیاز به تبعیت از مقامات بالاتر»، «کاهش حساسیت عملیات کاری سازمان»، «نیاز به منابع مالی»، «نیاز به ایجاد شفافیت»، «نیاز به منابع انسانی» و «نیاز به منابع فناوری اطلاعات» به عنوان عوامل تأثیرگذار در مشارکت سازمان های دولتی در ارائه داده ها به صورت باز استخراج شدند. 
۴.

A Socio-economic Analysis of the Online Gambling(مقاله علمی وزارت علوم)

کلیدواژه‌ها: Online gambling Socio-Economic Analysis Behavioral economy mental accounting

حوزه‌های تخصصی:
تعداد بازدید : ۲۱۲ تعداد دانلود : ۱۴۹
This research delves into the socio-economic aspects of online gambling in Iran, exploring the underlying cultural drivers that have contributed to its rapid growth in recent years. Online gambling's prevalence is intricately linked to cultural norms and values, both overt and covert, which have shaped its emergence in the country. Despite the religious, legal, and cultural taboos associated with gambling in Iran, this study investigates the cultural motifs that have challenged these obstacles, particularly among the youth. To unravel the psychological mechanisms at play among young online gamblers, this study adopts a qualitative approach, employing in-depth interviews with 17 male online gamblers aged between 20 and 40, alongside participatory observations. The data is analyzed thematically, with a focus on cultural motifs that reinforce mental accounting biases, drawing from the principles of behavioral economics. Notably, the central theme that emerges from this analysis is the "psychology of success", a worldview that influences the mindset and actions of individuals engaged in online gambling. The findings of this study reveal a significant thematic alignment between the teachings of the psychology of success and the cultural elements that bolster cognitive biases in the speech and conduct of online gamblers. The psychology of success, which emphasizes a sense of agency and empowerment, appears to drive cultural change and contributes to the widespread acceptance of online gambling despite its illegitimate status. Furthermore, the study highlights a connection between the prevalence of online gambling and the devaluation of the national currency.
۵.

تشخیص گفتمان در بستر توییتر با کاربست نظریه تمرکز نظارتی؛کاربست روشهای متن کاوی(مقاله علمی وزارت علوم)

تعداد بازدید : ۴۶۴ تعداد دانلود : ۲۹۶
هدف : متناسب سازی نظریه های علوم اجتماعی با فضای بسترهای رسانه اجتماعی موجب ارائه تحلیلهایی دقیق تر برای درک چرایی و چگونگی تغییر رفتار کاربران بسترهای رسانه اجتماعی می شود. هدف پژوهش حاضر، استخراج الگوهای موجود در محتوای تولید شده توسط کاربران توییتر بود که برای تحقق آن از نظریه تمرکز نظارتی بهره برده شده است. روش: این پژوهش از روشهای متن کاوی استفاده کرده و جامعه آماری آن، شامل متنهای انتشاریافته در توییتر طی بازه زمانی تیرماه 1399 تا تیرماه 1400 بوده است. داده های مورد استفاده در این پژوهش با تمرکز بر کلیدواژه های مرتبط با موضوع حجاب گردآوری شده است. یافته ها: داده های استخراج شده، تعداد 33192 توییت بود که پس از پاکسازی، 1967 توییت نمونه بر مبنای نظریه تمرکز نظارتی برچسب گذاری شد. در این پژوهش، توییت های نمونه با توجه به پیش فرض مثبت یا منفی، به دو دسته توییت های پیشبردی و اجتنابی دسته بندی شدند. بر این اساس، تعداد 815 توییت پیشبردی و 1152 توییت اجتنابی شناسایی شد. سپس توییت های پیشبردی در دو دسته توییت های برخورداری و محرومیتی و توییت های اجتنابی در دو دسته توییت های گریزی و مواجه ای دسته بندی و الگوسازی شدند. در ادامه، برای تشخیص گفتمانهای موجود در حوزه حجاب در توییتر، با استفاده از روشهای متن کاوی، مدل سازی انجام گرفت. نتیجه گیری: چهار گفتمان برخورداری، محرومیت، گریز و مواجهه، در توییت های بررسی شده تشخیص داده شد که نشان از تکرار بالای کدها در الگوی مواجهه دارد. از این تکرار بالای کدها می توان انسجام معنایی در الگوی مواجهه در توییتر و سپس جامعه را استدلال کرد. انسجام معنایی، جهت دهی به افکار عمومی را تسهیل می کند و انسجام رویکردی نیز بسیج عمومی برای تحول خواهی در موضوعات فرهنگی را ایجاد خواهد کرد.
۶.

بررسی جامعه شناختی قمار آنلاین در شبکه های اجتماعی

کلیدواژه‌ها: جامعه شناسی شرط بندی قمار آنلاین داده کاوی شبکه های اجتماعی بی ثباتی اقتصادی اقتصاد رفتاری

حوزه‌های تخصصی:
تعداد بازدید : ۴۰۳ تعداد دانلود : ۲۸۹
هدف: در پژوهش حاضر، پدیده شیوع قمار آنلاین در ایران با رویکرد آسیب شناختی در شبکه های اجتماعی واکاوی شده است. برای این منظور، پس از تحلیل رفتار کاربران و محتوای منتشرشده از سوی گردانندگان در دو شبکه مجازی تلگرام و اینستاگرام، به واکاوی جامعه شناختی این پدیده پرداخته شد. روش: برای جداسازی و استخراج پست های شرط بندی در هر بستر، مدلی بر اساس الگوریتم با نظارت رگرسیون لجستیک توسعه داده شد. همچنین، در راستای بررسی پست های برتر، از معیار جمع لایک و کامنت در اینستاگرام و میزان بازدید در تلگرام استفاده شد. پس از پاک سازی و حذف داده های نامرتبط، به تحلیل کمّی داده های عددی و تحلیل محتوای کیفی داده های متنی پرداخته شد. تحلیل کیفی داده ها نیز با استفاده از رویکردهای «بی ثباتی اقتصادی» و «اقتصاد رفتاری» انجام گرفت. یافته ها: در بستر تلگرام، پس از مقایسه نسبت بازدیدها به انتشار مطالب در هر گروه موضوعی، مشاهده شد که مخاطبان موضوع «تجارت و بازرگانی» با اختلاف بسیاری از موضوع های دیگر، به شرط بندی واکنش نشان می دهند که این از اهمیت ویژه موضوع اقتصاد در دغدغه های مخاطبان به شرط بندی حکایت می کند. محتوای پست ها و سوژه های داغ در سه مقوله محوری «انگیزش مالی»، «بیکاری» و «نوسان های نرخ ارز» (ذیل مضمون اصلی بی ثباتی اقتصادی) و دو مقوله محوری «سوگیری کاهش درد پرداخت» و «توهم کنترل» (ذیل مضمون سوگیری شناختی) قرار گرفت. نتیجه گیری: نتایج بیانگرِ استفاده گردانندگان سایت های شرط بندی از سازوکارهای ایجاد اختلال در حسابداری ذهنی مخاطبان است و از اولویت دغدغه های اقتصادی در کاربران، تحت تأثیر تغییرات در ساختار کلان اقتصاد کشور حکایت می کند.

پالایش نتایج جستجو

تعداد نتایج در یک صفحه:

درجه علمی

مجله

سال

حوزه تخصصی

زبان