وبلاگ

توضیح وبلاگ من

دانلود مطالب پژوهشی در رابطه با بررسی روایی و اعتبار ...

 
تاریخ: 29-09-00
نویسنده: فاطمه کرمانی

شاطریان محمدی (۱۳۸۴) به منظور تعیین میزان مهارت دبیران شهرستان قم در طراحی سوالات
امتحانی، به بررسی میزان روایی، اعتبار و شاخص­ های دشواری و تمیز سوالات آزمون­های معلم ساخته پرداخته است. کلیه اوراق امتحانی ترم اول و دوم دروس ریاضی، فیزیک، شیمی، عربی و زبان سال اول دوره متوسطه شهرستان قم در سال تحصیلی ۸۴ – ۱۳۸۳ و همچنین کلیه اوراق امتحانی ترم دوم سال تحصیلی ۸۳ – ۸۲ جامعه آماری این تحقیق را تشکیل می­ دهند. از این میان، ۹۶ ورقه سوال امتحان و تعداد ۱۷۱۲ ورقه پاسخنامه با روش نمونه گیری خوشه­ای چند مرحله­ ای مورد تحلیل قرار گرفت. نتایج این پژوهش نشان داد که:
دروس مورد بررسی از روایی محتوایی و صوری خوبی برخوردارند که درس ریاضی بالاترین
میزان روایی را به خود اختصاص داده است. برای تعیین روایی محتوایی و صوری، دو متخصص در هر درس به ارزیابی سوالات پرداختند. همچنین، اکثریت سوالات دروس مورد بررسی در سطح دانش و ادراک می باشد و از سطوح تحلیل، ترکیب و ارزشیابی سوالی نیامده است.

( اینجا فقط تکه ای از متن پایان نامه درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. )

تمامی دروس مورد بررسی از اعتبار مصححان بسیار بالایی برخوردار است. به منظور محاسبه این
نوع اعتبار، دو دبیر در هر درس، ۲۰۰ ورقه پاسخنامه را مجدداً تصحیح و جداگانه نمره­گذاری نمودند. در نهایت، از ضریب توافق کندال برای بررسی میزان توافق دبیران مصحح استفاده شد.
سوالات دروس مورد بررسی از ضریب دشواری متوسطی برخوردار هستند که بیشترین و کمترین
ضریب متعلق به دروس ریاضی و زبان (۶۰/۰ ، ۵۱/۰) می باشد. همچنین به غیر از سوالات درس ریاضی که از ضریب تمیز بسیار خوبی (۵۱/۰) برخوردار است بقیه دروس از ضریب تمیز نسبتاً خوبی (۳۵/۰ تا ۳۹/۰) برخوردارند. از آنجا که بیشتر سوالات طراحی شده از نوع تشریحی بوده برای محاسبه این نوع ضرایب، از فرمول­های ضرایب تمیز و دشواری مخصوص سوالات تشریحی استفاده شده است.
سلیمانی (۱۳۸۴) به بررسی روایی محتوایی، شاخص­ های سوالات و رعایت اصول علمی طراحی
سوالات امتحانی دروس ریاضی پرداخت. اولین گروه ازجامعه آماری این تحقیق، سوالات امتحانی دروس ریاضی مقطع متوسطه نظری مراکز آموزشی استان کرمانشاه در امتحانات پایانی خرداد ماه ۸۳ بود که با روش نمونه گیری تصادفی، از میان آن ها ۲۴۰ نمونه سوال طراحی شده به تناسب جمعیت دانش­آموزی مناطق و نواحی استان در پایه­ های اول و دوم انتخاب و در پایه سوم به دلیل هماهنگ بودن سوالات در سطح استانی، تک نمونه ­ای از سوالات طراحی شده از هر درس انتخاب گردید. دومین گروه جامعه آماری عبارت بود از؛ اوراق امتحانی دروس ریاضی فیزیک و علوم تجربی که در حوزه ­های تصحیح امتحانات نهایی، تصحیح و ارزشیابی شده بودند که از میان آن ها، تعداد ۲۸۰ ورقه تصحیح شده از هر یک از دروس مورد مطالعه (جمعاً ۱۱۲۰ ورقه) انتخاب گردید. به منظور بررسی روایی محتوایی، از یک پرسشنامه ۱۰۰ امتیازی که در مقیاس ۵ درجه­ای تنظیم و توسط حداقل ۳ ارزیاب امتیازدهی شده بود، استفاده گردید. از نتایج به دست آمده از این تحقیق می­توان به موارد زیر اشاره کرد؛
در مجموع سوالات از روایی محتوایی نسبتاً قابل قبولی برخوردارند.
در همه دروس، بیشتر سوالات طراحی شده، متعلق به سطوح پایین حیطه شناختی است و اصل
ترتیب سوالات از ساده به مشکل رعایت نشده است. همچنین طراحان سوال توجه کمتری به رعایت زمان تخصیص داده شده متناسب با سطح دشواری سوالات داشته اند.
هر چند سوالات، ضریب دشواری متوسطی دارند ولی از ضریب تشخیص پایینی برخوردار
می­باشند.
میانگین نمره در دروس امتحانات­نهایی پایین بوده است.
حشمتی، رافع و جمشیدی نژاد (۱۳۸۳) با هدف تعیین میزان اعتبار آزمون­ها، ضریب تشخیص و
سطح دشواری سوالات به تجزیه و تحلیل نتایج امتحانات­نهایی سال سوم متوسطه خرداد ۸۱ پرداختند. اوراق امتحانی کلیه دانش آموزان روزانه سال سوم متوسطه نظری تمام استان ها که در امتحانات نهایی ۸۱ شرکت کرده بودند جامعه آماری این مطالعه را تشکیل می­دهد که با روش نمونه گیری تصادفی طبقه­ای، ۷۵۰۰۰ ورقه امتحانی دانش ­آموزان انتخاب شد و سوالات آن مورد بررسی قرار گرفت. در هر استان ۵ منطقه (۱منطقه برخوردار، ۲منطقه غیر برخوردار و ۲ منطقه نیمه برخوردار) و سپس در هر رشته به تفکیک جنسیت، ۱۸۰ورقه امتحانی از منطقه برخوردار و ۳۲۰ ورقه از مناطق غیر برخوردار و نیمه برخوردار به تصادف انتخاب گردید. دروس مورد مطالعه عبارت بودند از؛ شیمی، حسابان، جبر و احتمال، ریاضی۳، فیزیک۳ تجربی و ریاضی، دینی و زیست شناسی. از نتایج این تحقیق:
در مجموع اعتبار (با بهره گرفتن از آلفای کرونباخ) آزمون­های مورد مطالعه قابل توجه بوده است.
کمترین و بیشترین میزان اعتبار به ترتیب مربوط به آزمون­های فیزیک گروه تجربی(۲۹/۰) و زیست­شناسی (۹۴/۰) در استان تهران می­باشد. میانگین اعتبار زیست­شناسی در سراسر کشور برابر ۹۰/۰ به دست آمده است.
افزایش عملکرد مناطق برخوردار نسبت به نیمه برخوردار و غیر برخوردار کمی بیش از متوسط
(با میانگین ۶۹ درصد) است که برای درس زیست شناسی به ۶۰% می رسد. گفتنی است تقسیم بندی مناطق بر اساس ملاک­های غیر آموزشی بوده است.
منحنی خصیصه سوال در اغلب استان­ها و دروس مختلف در حد قابل قبولی نیست. به طور
متوسط، ۴۹% امتحاناتی که در سطح استان­ها برگزار شده است، توانایی تفکیک دانش ­آموزان قوی و ضعیف را از هم دارند. به بیانی دیگر، امتحانات خرداد ۸۱ در تفکیک دانش ­آموزان از توانایی قابل توجهی برخوردار نیستند.
به غیر از تعداد اندکی از سوالات، ضریب دشواری سایر سوالات در دامنه بهینه قرار دارد و اکثریت
سوالات همبستگی مناسبی با نمره کل آزمون دارند که نشان دهنده همسانی مناسب سوالات آزمون است.
تجزیه و تحلیل آزمون زیست­شناسی در استان لرستان به شرح زیر است؛
اعتبار این آزمون ۸۶/۰ به دست آمده است. همچنین، میانگین آزمون زیست شناسی۱۳/۱۲ و دامنه نمره (۲۵/۱۹- ۲۵/۰) است. میانگین ضریب دشواری آزمون زیست شناسی ۶۱/۰ است و دشواری ۲۳ سوال از ۳۰ سوال آن در دامنه بهینه قرار دارد. نتایج ضریب همبستگی نشان می­دهد که سوالات از ضریب تشخیص مناسبی برخوردارند. منحنی خصیصه سوال درس زیست شناسی در استان لرستان نشان می­دهد که ۹ سوال از کیفیت مطلوبی برخوردار نیستند. استان لرستان در گروه استان­هایی قرار می­گیرد که عملکرد منحنی خصیصه سوال در آزمون زیست­شناسی تا حدی قابل قبول است.
رستگاری مقدم (۱۳۷۸) در مطالعه ای به بررسی میزان اتکاپذیری و تعمیم پذیری نتایج امتحان
کنکور کارشناسی ارشد رشته­ های معارف اسلامی، فلسفه و نمایش­نامه­نویسی با بهره گرفتن از نظریه تعمیم­پذیری پرداخت. داوطلبان آزمون سراسری وروری کارشناسی ارشد سال ۱۳۷۷ که امتحان آن­ها به صورت تشریحی برگزار شده بود، جامعه ی آماری این مطالعه را تشکیل دادند و جامعه مرجع مشاهدات قابل قبول، شامل دو رویه­ی سوالات و درجه بندی­کنندگان بود که فرض شد این دو، نامحدود هستند. نتایج این مطالعه که با بهره گرفتن از نرم افزار spss و بخشی به صورت دستی به دست آمد (به دلیل در دسترس نبودن نرم افزار تخصصی)، به شرح زیر می­باشد:
تعداد درجه­بندی کنندگان مورد استفاده توسط سازمان سنجش کافی ولی تعداد سوالات مورد استفاده کم می­باشد و برای به دست آوردن نتایج مطلوب و مورد اعتماد، افزایش تعداد سوالات بسیار ضروری می­باشد. تقریباً برای تمام دروس، به دست آوردن نتایج دقیق و قابل اتکا مستلزم استفاده از حداقل دو درجه­بندی کننده و ۱۰ سوال از این نوع سوالات می­باشد.
سادئی (۱۳۷۶) به مقایسه­ تحلیلی امتحانات هماهنگ و داخلی دوره­ متوسطه و انطباق آن با
ملاک­های علمی طراحی سوال و آزمون­سازی پرداخت. سوالات امتحانات داخلی و هماهنگ دروس ریاضی۱و۲، فیزیک ۱و۲، شیمی۱و۲ ، زبان خارجی۱ و دانش اجتماعی که در سال تحصیلی ۱۳۷۶-۱۳۷۵ در شهر مشهد به اجرا درآمده بود، جامعه آماری این تحقیق را تشکیل می­دادند. از میان آن­ها با روش نمونه گیری خوشه­ای تصادفی، ۱۰ آزمون داخلی با ۱۳۲ سوال، ۲۳ آزمون هماهنگ کشوری- استانی- ناحیه ای با ۴۱۶ سوال انتخاب و نیز نمرات (نمره سوال و نمره کل آزمون) ۲۰۰۹ دانش ­آموز در ۶۴ کلاس درس متعلق به نواحی ۳ و ۵ جمع­آوری گردید. به منظور مقایسه ی محتوای آزمون­های داخلی و هماهنگ از نظر رعایت ملاک­های علمی آزمون سازی، هر یک از امتحانات اجرا شده در سه نسخه تکثیر و توسط ۳ دبیر متخصص بر اساس ۱۴ ملاک علمی ارزشیابی شد. نتایج مرتبط با این تحقیق عبارتند از:
هر قدر طراحی سوالات با اهداف آموزشی و درسی و ملاک­های علمی آزمون­سازی انطباق بیشتری
داشته باشد، دانش ­آموزان نیز موفقیت بیشتری کسب می کنند و بالعکس.
هر چند عملکرد دانش ­آموزان از مواد درسی مورد بررسی، خیلی مطلوب نیست اما آزمون­های
داخلی و هماهنگ معمولاً با ملاک های علمی طراحی سوال و آزمون سازی انطباق دارد.
الزیبی[۱۴۹] (۲۰۱۴) به تحلیل سوالات زبان انگلیسی برگرفته از امتحانات دیپلم دبیرستان از طریق سطوح
شناختی بلوم پرداخت. سوالات انگلیسی (دو سطح ۳ و۴) استفاده شده در امتحانات عمومی دبیرستان در اردن برای سال­های تحصیلی(۲۰۱۳ – ۲۰۱۰) که توسط وزارت آموزش و پرورش تهیه شده بود، به تعداد ۳۷۵ سوال نمونه این مطالعه را تشکیل می­دهد. ۶/۶۹ درصد از کل سوالات، سطوح پایین شناختی(دانش، ادراک و کاربرد) را می­سنجند و سطح ادراک با ۱/۳۳% بیشترین تعداد سوال را به خود اختصاص داده است. در مجموع نتیجه گرفته می­ شود که امتحانات عمومی دبیرستان بر سطوح پایین تفکر تمرکز دارند.
ویکمن[۱۵۰] (۲۰۱۳)، آزمون [۱۵۱]ACCESS (ارزیابی درک مطلب و برقراری ارتباط در ایالت انگلیسی زبان- ایالت زبان
آموزان انگلیسی) را به عنوان اندازه پیش ­بینی­کننده­ موفقیت در آزمون EOCT (امتحان نهایی) زیست­شناسی، بر
روی یادگیرندگان انگلیسی در جورجیا به کار گرفت. این مطالعه دو ارزیابی استاندارد را مقایسه می­ کند که دانش ­آموزان زبان­آموز در کلاس نهم باید بگذرانند. اول آزمون ACCESS برای سنجش سالیانه پیشرفت یادگیری زبان یادگیرندگان انگلیسی و دوم آزمون [۱۵۲]EOCTزیست شناسی است که برای تعیین تسلط محتوای درس به کار می رود. در سال تحصیلی ۲۰۱۳-۲۰۱۲، EOCTs به عنوان ابزاری که تعیین می­ کند، آیا یک دانش ­آموز از دبیرستان می ­تواند دیپلم بگیرد یا خیر، جایگزین آزمون فارغ­التحصیلی جورجیا شد. ۱۰ تا EOCT وجود دارد که دانش ­آموزان باید در دوران دبیرستان جهت فارغ­التحصیل شدن بگذرانند. EOCT مورد نیاز برای دانش ­آموزان کلاس نهم، ادبیات و نگارش، زیست­شناسی، ریاضی و … را شامل می­ شود. دانش آموزان کلاس نهم دبیرستان که در سال های ۲۰۰۷ تا ۲۰۱۲ مشغول به تحصیل بودند، نمونه این تحقیق را تشکیل می­ دهند. با نمونه گیری هدفمند، ناحیه آموزشی انتخاب و از جامعه­ در دسترس به طور تصادفی ۱۶۴ نفر انتخاب شد. از یافته­های این تحقیق:
۱۲۴ نفر (۷۶%) در آزمون EOCT زیست شناسی رد شدند و تعداد کمی از دانش آموزان (۴۰ نفر) از
هر دو جنس توانستند نمره­ی قبولی را کسب کنند. نمره­ی قبولی این آزمون ۴۰۰ است که نمره­ی میانگین قبول شدگان در آزمون زیست­شناسی ۴۱۶ می­باشد.
نمره­ی پسران در هر دو آزمون نسبت به دختران خیلی بیشتر است به طوریکه ۷۵ درصد
قبول­شدگان، پسر هستند. در پسران به ازای هر واحد افزایش در نمره­ی ACCESS، ۶۸/۸ امتیاز به نمره­ی EOCT زیست اضافه می­ شود در حالیکه هیچ نمره­ای به دختران افزوده نشد. این نتایج نشان دهنده شکاف جنسیتی در نمونه مورد مطالعه است. جنسیت، نقش مهمی در پیش بینی موفقیت یادگیرندگان زبان در EOCT زیست شناسی داشت.
مهری[۱۵۳] (۲۰۱۳) به مقایسه پیشرفت­تحصیلی دانش ­آموزان کلاس نهم در درس زیست­شناسی در
مدارس دولتی و خصوصی کابل پرداخت. یافته ها نشان از بالا بودن ۶ درجه ای نمره ی میانگین دختران در هر دو مدارس نسبت به پسران است.
گزیلر[۱۵۴]، ازدیمیر[۱۵۵] و دیکیجه[۱۵۶] (۲۰۱۲) به بررسی تطبیقی سوالات امتحانی معلم ساخته ریاضیات
ابتدایی و سوالات تعیین سطح ریاضیات برای دانش ­آموزان کلاس­های ششم، هفتم و هشتم به منظور تعیین سطح علمی سوالات بر اساس طبقه ­بندی بلوم پرداختند. ۷۱۵ سوال امتحانی معلمان ریاضی شاغل در ۱۲ مدرسه ابتدایی مختلف در سال­های تحصیلی ۲۰۱۰ – ۲۰۰۹ در ازورم به طور تصادفی انتخاب شدند و در کنار ۵۴ سوال از امتحانات تعیین سطح ریاضی، نمونه این مطالعه را تشکیل دادند. کمیته­ای شامل سه مدرس ریاضی به طبقه ­بندی سوالات پرداختند. نتیجه­ مطالعه این بود که هر دو نوع سوالات عموماً با سطوح پایین شناختی در ارتباطند.
گولار و گلبال[۱۵۷] (۲۰۱۰)، در مطالعه­ ای با عنوان « مطالعه اعتبار سوالات باز پاسخ ریاضی بر اساس
نظریه کلاسیک و تعمیم­پذیری» ۲۴ سوال باز پاسخ ریاضی را از تیمز ۱۹۹۹ بر روی ۲۰۳ دانش ­آموز در سال ۲۰۰۷ اجرا کرد. برای برآورد ضریب تعمیم­پذیری از طرح کاملاً متقاطع استفاده شد. درصد واریانس تبیین شده توسط مولفه واریانس دانش ­آموزان ۶/۳۲ % از کل واریانس در نمره­ها بود واریانس سوالات ۵/۴ % از کل وریانس را تشکیل می­داد که نشان می­دهد کمتر از ۵ % تغییر­پذیری در مدل، مربوط به رویه سوالات است. واریانس ارزیابان که کمترین مقدار مولفه واریانس بود حدود ۱/۲% از کل واریانس را تشکیل می داد، که این نشان دهنده آن است که بین ارزیابان همسانی وجود دارد. ضریب همسانی درونی سوالات ۹۲/۰ ، ضریب توافق کندال بین داوران ۵۲/۰، ضریب تعمیم­پذیری برای نمرات ریاضی ۹۲/۰ و ضریب فای ۹۰/۰ به دست آمد. مولفه واریانس داوران، ۱/۲% از کل واریانس را تشکیل می­داد. براساس نتایج این پژوهش به نظر می­رسید که ابزار اندازه گیری پیشرفت ریاضیات برای تعیین موفقیت دانش ­آموزان ابزاری معتبر است.


فرم در حال بارگذاری ...

« راهنمای ﻧﮕﺎرش ﻣﻘﺎﻟﻪ ﭘﮋوهشی در مورد الگوی هم پیوند ...طرح های پژوهشی و تحقیقاتی دانشگاه ها با موضوع : شناسایی و ... »