اندازه گیری، سنجش و ارزشیابی آموزشی
تعریف آزمون:
مقدمه:اندازه گیری یک فرایند است، این فرایند نیاز به یک وسیله دارد که به آن آزمون می گویند.
آزمون وسیله ای است برای اندازه گیری صفات فیزیکی (جسمی) و روانی، چون متخصصین اندازه گیری به ویژگی های روانی مورد نظر برای اندازه گیری دسترسی ندارند ناچار به اندازه گیری رفتارهایی که معرف ویژگی روانی است می پردازند.
رفتار چون متنوع و فراوان است نمی توان به اندازه گیری همه آن ها دست یافت، بنابراین نمونه ای از رفتار مورد بررسی قرار می گیرد.
تعریف:« آزمون وسیله یا روشی است نظام دار ( یا نظام مند) برای اندازه گیری نمونه ای از رفتار است» .
« گرانلاند ولین 1990»
نیکتو (2001) در تعریف اصطلاح آزمون گفته است:« آزمون به عنوان یک ابزار با یک شیوه نظام دار مشاهده و توصیف ویژگی های دانش آموزان با یک مقیاس عددی یا یک طرح طبقه بندی را به کار می بندد تعریف می شود».
تعریف سنجش:
« سنجش یک اصطلاح کلی است و به صورت فرایندی تعریف می شود که برای گردآوری اطلاعات مورد نیاز تصمیم گیری درباره دانش آموزان، برنامه های درسی و سیاست های آموزشب مورد استفاده قرار می گیرد.
« اگن و گاوچاک 2001»
ونگلینز (1993) در تعریف سنجش گفته است:« سنجش به یک تحلیل جامع و چند وجهی از عملکرد گفته می شود». او همچنین در مقایسه سنجش و آزمون از قول کرانباخ نقل کرده است: « سنجش شامل استفاده از فنون مختلف است و تاکیدزیادی بر مشاهده عملکرد دارد...»
سنجش نوعی تحلیل بالینی و پیش بینی عملکرد است در حالی که آزمون یک وسیله اندازه گیری است.
تعریف ارزشیابی:
ارزشیابی به معنی تعیین ارزش و داوری کردن است.
« ارزشیابی به یک فرآیند نظام دار برای جمع آوری، تحلیل و تفسیر اطلاعات گفته می شود به این منظور که تعیین کند آیا هدف های مورد نظر تحقق یافته اند یا در حال تحقق یافتن هستند و به چه میزانی؟»
« گِی1991»
یکی از ویژگی های مهم ارزشیابی تعیین کیفیت است.
تعریف کیفیت: ( در ارزشیابی پیشرفت تحصیلی)
« کیفیت عبارتست از دانش، مهارت ها و توانایی هایی که از دانش آموزان پس از آموزش انتظار می رود».
« نیکتو2001 »
مثال: تعیین کیفیت افراد در یک مسابقه مقاله نویسی یا مرور نوشته های دانش آموز و مرور نمره های وی
علاوه بر ارزشیابی پیشرفت درسی دانش آموزان، ارزشیابی با موضوع های دیگری سرو کار دارد.
مثال: عملکرد معلمان و مدیران، روش های آموزشی، برنامه های درسی دوره های آموزشی، مواد آموزشی، پروژه های آموزشی و سازمان های آموزشی.
یک ارزشیاب، ابتدا هدف های کلی برنامه درسی را مشخص می کند و سپس میزان تحقق آن ها را بررسی می کند.
ورتن و سندرز (1987) دو تن از صاحب نظران حوزه ارزشیابی آموزش گفته اند:
« در آموزش و پرورش، ارزشیابی به یک فعالیت رسمی گفته می شود که برای تعیین کیفیت، اثربخشی یا ارزش یک برنامه، فرآورده پروژه، فرآیند، هدف یا برنامه درسی به اجرا در می آید».
مقایسه اندازه گیری، آزمون، سنجش و ارزشیابی با یکدیگر:
ارزشیابی برای داوری درباره کیفیت موضوع است و ارزش اطلاعات به دست آمده را بررسی می کند. که مستلزم تحلیل و تفسیر اطلاعات جمع آوری شده است.
اطلاعات مورد نیاز ارزشیابی آموزشی که کمک اندازه گیری ( آزمون) و سنجش جمع آوری می شود.
البته سنجش یک فرآیند مبتنی بر مشاهده عملکرد و شیرینی عملکرد است در حالی که ازمون یک وسیله اندازه گیری است.
تعریف و انواع مقیاس های اندازه گیری:
بنا به تعریف:
« مقیاس مجموعه ای عدد ( یا نمادهای دیگر) است که ویژگی های آن ها بر ویژگی های تجربی اشیایی که اعداد به آن ها نسبت داده می شوند منطبق است». « کوهن و سورد لیک2002»
انواع مقیاس های اندازه گیری در چهار سطح دسته بندی شده است:اسمی، ترتیبی، فاصله ای، نسبتی
« استیونس1951»
مقیاس اسمی
1ـ اسم گذاری 2ـ طبقه بندی
عملیات مجاز آماری:
شمارش فراوانی و تعیین نما
عملیات مجاز ریاضی:
انجام هیچ یک از چهار عمل اصلی جمع، تفریق، ضرب و تقسیم در این مقیاس میسر نیست.
مقیاس ترتیبی
1ـ دسته ای از افراد و اشیاء با توجه به یک صفت از بزرگ به کوچک (یا بالعکس) مرتب شده اند.
2ـ معلوم نیست هر یک از اشیاء چقدر از آن صفت را دارند.
3ـ و نیز مشخص نیست این اشیاء یا افراد از لحاظ صفت مورد اندازه گیری چقدر با هم فاصله دارند.
« ناتالی 1978»
عملیات مجاز آماری:
شمارش فراوانی، تعیین نما، محاسبه میانه، محاسبه درصدها و محاسبه ضریب همبستگی رتبه ای اسپیرمن
عملیات مجاز ریاضی:
هیچ یک از چهار عمل اصلی جمع، تفریق، ضرب و تقسیم
مقیاس فاصله ای
1ـ در آن رتبه اشیاء ( یا افراد) با توجه به یک صفت مشخص است.
2ـ معلوم است که اشیاء ( یا افراد) از لحاظ صفت مورد اندازه گیری چقدر از هم فاصله دارند
3ـ اما هیچ اطلاعی از مقدار قدر مطلق مورد نظر برای هیچ یک از افراد در دست نیست
« ناتالی 1978»
عملیات مجاز آماری:
محاسبه نما، میانه، میانگین، انحراف معیار، ضریب همبستگی رتبه ای اسپیرمن، ضریب همبستگی گشتاوری پیرسون
عملیات مجاز ریاضی:
جمع و تفریق مجاز است، ضرب و تقسیم مجاز نیست.
مقیاس نسبتی
1ـ در آن رتبه اشخاص با توجه به یک صفت معلوم است.
2ـ فاصله اشخاص معلوم است.
3ـ علاوه بر این ها فاصله حداقل یکی از اشخاص از یک صفر منطقی معلوم است.
اندازه گیری طول، وزن، حجم و سایر صفات فیزیکی افراد با مقیاس نسبتی عملی است. اما اندازه گیری متغیرهای روانی و پرورشی با این مقیاس به ندرت میسر است. « ناتالی 1978»
عملیات مجاز آماری و ریاضی:
در این مقیاس همه عملیات آماری و ریاضی مجاز است.
مقیاس
1ـ مقیاس گسسته 2ـ مقیاس پیوسته
حد واقعی اعداد: حد واقعی ارزش عددی یک متغیر پیوسته برابراست با آن عدد به اضافه یا منهای نصف واحد اندازه گیری (رونیون و هابر1976)
دسته بندی آزمون های مورد استفاده در آموزش و پرورش
1ـ آزمون های توانایی 2ـ آزمون های عاطفی
1ـ آزمون های توانایی:
آزمون های توانایی آموخته ها، استعدادها و مهارت های افراد را می سنجد:
دسته ای از این آزمون ها توانیی های شناختی را می سنجد که برای فعالیت های ذهنی و فکری و تحصیلی کاربرد دارند.
دسته ای دیگر توانایی های روان ـ حرکتی را می سنجد که برای فعالیت های صنعتی، تربیت بدنی، نظامی و . . . به کار می روند.
ویژگی مهم این آزمون ها این است که از آزمون شونده خواسته می شود حداکثر نمره ممکن را کسب کند.
انواع آزمون های توانایی
1ـ آزمون های استعداد:
میزان توانایی فرد را برای کارهایی که باید انجام دهد می سنجد.
2ـ آزمون های پیشرفت تحصیلی:
مهارتهای کسب شده فرد را اندازه گیری می کنند.
آزمون های توانایی
آزمون پیشرفت تحصیلی آزمون استعداد
آزمون ریاضی آزمون فیزیک آزمون مهارت های فنی آزمون های هوش(استعداد کلی) آزمون استعداد ویژه
استعداد ریاضی استعداد موسیقی استعداد فنی
ثورندایک و هیگن ( 1979) در کتاب معروف خود با عنوان اندازه گیری و ارزشیابی در روان شناسی و آموزش و پرورش در رابطه با آزمون های استعداد و پیشرفت تحصیلی به گونه زیر نظر داده اند:
« باید به خاطر داشت که همه آزمون های توانایی، صرف نظر از نامی که دارند توانایی های موجود فرد را اندازه می گیرند. ما نمی توانیم مستقیما توانایی «ذاتی » یا « ارثی» کسی را اندازه گیری کنیم. آن چه را که ما می توانیم در فرد اندازه بگیریم توانایی او برای انجام دادن اعمال در زمان حال است. بنابراین تمایز بین آزمون های استعداد و پیشرفت تحصیلی به قصد و منظوری مربوط می شود که نتایج ازمون برای آن قصد و منظور مود استفاده قرار می گیرند، نه به ماهیت یا محتوای آزمون »
2ـ آزمون های عاطفی
با وجود این به قول آیکن ( 1985) بسیاری از ابزارهای اندازه گیری عاطفی دارای ویژگی های خوب از جمله روایی و پایایی هستند و می توان از این ابزارها برای اندازه گیری شخصیت و سایر ویژگی های عاطفی استفاده کرد.
انواع آزمون های عاطفی
آزمون شخصیت آزمون علایق آزمون نگرش آزمون غیره
آزمون های شخصیت:
تعریف:
شخصیت مجموعه ای از رفتارهای فرد د موقعیت های اجتماعی است(ایبل1979)
از شخصیت تعاف گوناگون شده و شامل ابعاد مختلفی می باشد از جمله: هوش، پیشرفت، قد و قامت، وضع سلامتی، کیفیت صدا، وضع ظاهر و . . .
آزمون های شخصیت به طور عمده اندازه گیری متغیرهای
انگیزش Motivation
مزاج Temperament
سازگاری Adjostment
منش Caracter
ابزارهای اندازه گیری شخصیت
پرسشنامه گزارش شخصی پرسشنامه جامعه سنجی فنون مشاهده ای آزمون های فرافکن
( نظر شخصی نسبت به خود) ( نظر افراد دیگر نسبت به فرد) ( مشاهده رفتار فد در یک موقعیت)
2 و 3ـ آزمون های علاقه و نگرش:
شباهت ها:
1ـ هم علاقه و هم نگرش به دوست داشتن ها و دوست نداشتن های فرد اشاه می کند.
2ـ هر دو به انتخاب فرد درباره فعالیت ها و نهادهای اجتماعی و یا گوه ها ارتباط دارند.
3ـ هر دو شامل احساس های شخصی نسبت به امور هستند.
تفاوت علاقه و نگرش:علاقه به احساس یک فرد نسبت به فعالیت اشاره می کند درحالی که نگرش حاکی از احساس فرد نسبت به شی یا نهاد اجتملعی یا یک گروه است (مهرنز و لهمان 1984).
ابزار اندازه گیری:
پرسشنامه علائق و پرسشنامه نگرش
دسته بندی آزمون ها با توجه به چگونگی تهیه آن ها
1ـ آزمون های میزان شده 2 ـ آزمون های معلم ساخته
استاندارد بودن یا میزان بودن آزمون ( کران باخ 1990):
به این صوت است که شیوه های اجا، شیوه های مشاهده تجهیزات و مواد و قواعد نمره گذای تا آن اندازه تثبیت شده اندکه تا حد امکان د شرایط و زمان های مختلف نتایج یکسان به دست آید.
سه تفاوت آزمون های استاندارد ( میزان شده ) و معلم ساخته:
1ـ آزمون های میزان شده به زبان و تخصص بیشتری نیاز دارند چون برای گروه های زیاد و زبان های مختلف است،هزینه تخصص بیشتری می طلبد. محتوای درسی و مهارت نمونه گیری می شو،آزمون آزمایشیاجرا می شود،سوال ها تجزیه و تحلیل می شود و توسط متخصصان نوشته و ویرایش می شود.
2ـ از آن جا که آزمون های میزان شده برای استفاده در مناطق مختلف و دانش آموزان مناطق گوناگون تهیه می شود هدف های آموزشی را باید در این آزمون ها منظور کرد.
3ـ آزمون های میزان شده باید هنجار شوند در حالی که آزمون های معلم ساخته چنین نیازی ندارند.
موارد استفاده از آزمون های میزان شده و معلم ساخته
1ـ تصمیمات آموزشی مبوط به کم و کیف جریان آموزشی ⟸ آزمون های معلم ساخته
2ـ تصمیمات مربوط به ارتقای دانش آموزان و دانشجویان ⟸ آزمون های معلم ساخته
3ـ تصمیمات مربوط به مشاوره و اهنمایی ⟸ آزمون های میزان شده
4ـ تصمیمات بر مبنای مقایسه افراد و گروه ها ⟸ آزمون های میزان شده
5ـ تصمیمات مربوط به برنامه ریزی درسی ⟸ آزمون های میزان شده
6ـ تصمیمات در مورد ارزشیابی از میزان موفقیت مدارس مختلف ⟸ آزمون های میزان شده
جدول مشخصات آزمون:
بهترین آزمون، آزمونی است که تمام مطالب(محتوی) و کلیه ی هدفهای آموزشی آن درس را شامل شود.
جدول مشخصات آزمون به ایجاد تعادل بین آموزش و سنجش کمک می کند. (پین 2003)
جدول و فرمول توزیع سؤالات به بخشهای مختلف:
برای تعیین درصد سؤالها به بخشهای مختلف باید به سؤالات ذیل پاسخ داد:
1- کدام بخش از محتوا و هدفها دارای حجم بیشتری است و دقت آموزش را به خود اختصاص داد؟
2- کدام هدفها از نظر کاربرد و نگهداری حافظه اهمیت بیشتری دارد؟
3- کدام قسمت درسی از اهمیت بیشتری برخوردار است؟
نحوه توزیع سؤالات باید متناسب با جواب این سؤالها باشد:
چنانچه بخشهای مختلف از نظر اهمیت و کاربرد یکسان باشند برای توزیع سوالات به بخشهای از فرمول زیر استفاده می کنیم:
تعداد ساعتهایی که صرف تدریس آن بخش شده
تعداد کل ساعتهای تدریس
کل سؤالات×نسبت ساعت تدریس هر بخش= تعداد سؤالهای هر بخش
انواع آزمونهای پیشرفت تحصیلی کتبی
1- آزمون گسترده پاسخ: هیچ محدودیتی برای آزمون شونده منظور نمی شود.
مثال: قانون جاذبه و تأثیر آن را بر علم زمین شناسی شرح دهید.
2- آزمون محدود پاسخ: آزمون شونده ملزم است تا پاسخ خود را در چارچوب شرایط خاصی محدود کند.
مثال: توضیح دهید چرا آب در 100درجه به جوش می آید؟ پاسخ خود را در یک پاراگراف بنویسید.
1- در نوشتن سؤالات آزمون، دقت کنید با رسم مشخصات آن درس، سؤالات به طور مستقیم به هدفهای آموزشی آن درس مرتبط باشد.
2- سؤالهای تشریحی را تنها به هدفهایی محدود کنید که با سایر انواع آزمونها به خوبی قابل اندازه گیری نیستندو
3- صورت سؤالات تشریحی را عباراتی کاملاً روشن و واضح بنویسید و از کلی گویی و ابهام در بیان بپرهیزید.
4- از کاربرد کلمات «چه کسی، چه وقت، کجا و...» بپرهیزید.
5- تا حد امکان از سؤالهای تازه و جدید استفاده کنید.
6- در سؤالاتی که به ابراز عقیده مربوط می شود باید از آزمون شونده بخواهیم مستند پاسخ دهد و تنها عقیده شخصی خودر را نگوید.
7- به آزمون شوندگان حق انتخاب چند سؤال از میان سؤالات را ندهید.
8- برای پاخ به سؤالات وقت کافی در نظر بگیرید.
قواعد تصحیح سؤالهای تشریحی:
1- پاسخ سؤالها بر اساس هدفی که در سؤال گنجانده شده تصحیح کنید.
2- با انتخاب یک کلید پاسخ از دخالت عوامل نامربوط جلوگیری کنید.
3- پاسخ را سؤال به سؤال تصحیح کنید نه ورقه به ورقه.
4- هنگام تصحیح ورقه های امتحانی از شناسایی نام صاحبان آنها خودداری کنید.
5- در صورت امکان از یکی دو نفر از همکارانتان بخواهید که تصحیح شما را دوباره تصحیح کند.
6- تمام پاسخهای آزمون شوندگان به یک سؤال را در یک نشست و بدون وقفه تصحیح کنید.
7- به نمرات سؤالهای قبل نگاه نکنید.
8- بر روی برگه آزمون اشتباهات دانش آموزان را تصحیح کنید و نظرخود را بنویسی.
تعریف آزمون کوته پاسخ:
مجموعه ای از سؤالهای مختصر که دارای پاسخهای بسیار کوتاه و برای سنجش و هدفهای آموزشی سطح پایین طرح می شود تشکیل شده است.(نیکتو 1983 و لهمان1984)
انواع آزمونهای کوته پاسخ:
الف= نوع پرسشی
ب= نوع کامل کردنی
نوع تشخیصی
کاربرد آزمونهای کوته پاسخ:آزمونهای کوته پاسخ برای اندازه گیری هدفهای شناختی سطح پایین استفاده می شود. (گرانلاندولین1990)
1-- توانایی نشان دادن ارزش مکانی اعداد، تشخیص اندامهای یک موجود زنده، تعریف یک مثلث و ...
2- توانایی حل مسایل عددی در ریاضیات و علوم.
3- توانایی حل کردن معادلات ریاضی و شیمیایی.
1- هر سؤال باید موضوع مهمی را شامل شود.
2- صورت سؤالات را کاملاً روشن بنویسید.
3- صورت سؤال را از روی کتب عیناً نقل نکنید.
4- در سؤالهایی که پاسخ آنها عدد است، واحد مقیاس را با دقت مشخص کنید.
5- در سؤالات کامل کردنی تنها و عبارات مهم را حذف کنید.
6- در سؤالات کامل کردنی تعداد زیادی جای خالی منظور نکنید.
7- تا آنجایی که ممکن است جای خالی را در قسمت پایانی سؤال قرار دهید.
8- تا حد امکان به جای سؤالهای کامل کردنی، از سؤالهای پرسشی استفاده کنید.
9- در سؤالهای کامل کردنی، از کاربرد اشارات و مواردی که جواب سؤال را مشخص کند خوداری کنید.
تعریف آزمون های عینی:
آزمونهای عینی:
آزمونهای عینی (obje ctire) آزمونهایی هستند که در آنها هم سؤالات و جواب آنها در اختیار آزمون شوندگان قرار می گیرد و آزمون شوندگان درباره جوابها تصمیم می گیرند.
انواع آزمونهای عینی
انواع سؤالهای صحیح غلط:
1- نوه صحیح- غلط:
مثال: معلم در ابتدای کلاس باید با طرح پرسشهایی اطمینان یابد آیا دانش آموزان درس قبلی را فرا گرافته اند؟ صحیح – غلط
2- نوع بله – نه:
مثال: آیا فلسفه یک علم است؟ بله- نه
3- نوع اصلاحی:
مثال: جذر عدد64 9 است؟
دانش آموز باید عدد 9 را خط بزند و صحیح آن که 8 است را بنویسد.
4- نوع خوشه ای:
در این روش تنه سؤال به صورت جمله ناتمام نوشته می شود و بدنبال آن چند جواب قرار می گیرد.
مثال: میانگین حسابی:
1- یکی از اندازه های گرایش مرکزی است. صحیح- غلط
2- کمتر از میانه است تحت تأثیر نمرات خیلی بزرگ یا خیلی کوچک قرار می گیرد. صحیح- غلط
3- رابطه همبستگی بین دو متغیر را نشان می دهد. صحیح- غلط
قواعد تهیه سؤالهای صحیح - غلط
1- سؤالها را تا حد امکان مختصر، ساده و روشن بنویسید.
2- جمله هایی را بکار ببرید که درست یا غلط بودن آن ها برای کسانی که موضوع را یاد گرفته اند آشکار باشد.
3- از کاربرد کلماتی چون همه، بعضی وقتها، غالباً، هرگز و از این قبیل خودداری کنید.
4- سعی کنید تمام سؤالات صحیح- غلط هم اندازه باشند.
5- سؤالهای صحیح- غلط را از روی جمله های کتب ننویسید.
6- سعی کنید از مطالب بی اهمیت بپرهیزید.
آزمون جور کردنی:آزمونهای جور کردنی از دو ستون سؤالات و پاسخها تشکیل شده است که آزمون شونده باید پاسخ مربوط به هر سؤال را به آن سؤال مرتبط سازد.
مثال: ستون سؤالات ستون پاسخ
قواعد تهیه سؤالات جور کردنی:
1- پرسشها و پاسخهای متجانس و همگون انتخاب کنید.
2- طول سؤال و پاسخ را کوتاه انتخاب کنید.
3- در راهنمای سؤالات، اطلاعات لازم را درباره نحوه مقایسه و جور کردن پرسشها و پاسخ ها در اختیار دانش آموزان قرار دهید.
4- همه پرسشها و پاسخهای یک سؤال را در یک صفحه قرار دهید.
5- در صورت امکان فهرست پاسخها را به طور منطقی مرتب کنید.
6- در فهرست پرسشها از جملات نیمه تمام استفاده نکنید.
7- پرسشها را با شماره و پاسخ ها را با حروف مشخص کنید.
8- هر یک از پاسخها باید برای تمام پرسشهای یک سؤال درست جلوه کند.
9- از نوشتن سؤالهایی که پرسشها و پاسخهای آن ها کاملاً با هم جور می شوند بپرهیزید.
آزمون چند گزینه ای:قسمتهای مختلف سؤال چند گزینه ای
1- نوع تنها گزینه درست:
مثال: اگر 27=R، R برابر است با:
الف) 3 ب) 9 ج) 11 د)30
2- نوع بهترین گزینه:
مثال: کدام مورد تعریف کامل تری از یادگیری است؟
الف) کسب اطلاعات تازه در آموزش
ب) ایجاد تغییرات نسبتاً پایداردر توان رفتاری یاد گیرنده
ج) ایجاد تغییرات مطلوب و مورد نر در رفتار یادگیرنده
د) توانایی به خاطر سپردن و یادآوری تجارب پیشین
3- نوع منفی:
مثال: کدامیک از عبارتهای زیر درباره ویروس درست نیست؟
الف) ب) ج) د)
قواعد تهیه سؤالهای چند گزینه ای:
1- هر سؤال باید یک موضوع یا یک هدف آموزشی را در بر گیرد. (نیکتو 1983)
2- بیشتر از یک مسأله یا یک مطلب در هر سؤال قرار ندهید.
3- سؤالات را کاملاً روشن و واضح بنویسید.
4- از تکرار مطالب در گزینه ها خودداری کنید.
5- مطالب اصلی سؤال را به طور کامل در تنه سؤال بنویسید.
6- همه گزینه های یک سؤال باید متجانس و به موضوع واحدی مربوط باشد.
7- سؤال را طوری بنویسید که پاسخ درست تنها پاسخ درست یا درست ترین پاسخ باشد.
9- از به کار بردن اشاره های دستوری نامربوط خودداری کنید.
10- در سؤالات منفی کلمات منفی را برجسته کنید.
11- از نوشتن سؤالاتی که هم متن سؤال منفی و هم پاسخ منفی خودداری کنید.
12- تا حد امکان تاز گزینه همه موارد فوق خودداری کنید.
13- از طرح سؤالهای گمراه کننده بپرهیزید.
14- دو گزینه متضاد که یکی از آنها درست است بکار نبرید.
15- محل گزینه درست را میان گزینه های انحرافی تصادفی انتخاب کنید.
16- برای هر سؤال بین 3 تا 5 گزینه در نظر بگیرید.
17- عبارتهای هیچکدام یا هیچ یک از موارد فوق را زیاد بکار نبرید.
18- تنها در صورت لزوم از آزمونهای چند گزینه ای استفاده کنید.
نمره گذاری آزمون های عینی:
برای نمره گذاری آزمونهای عینی دو روش عمده وجود دارد:
نمره گذاری روش دوم:
مثال: در یک آزمون چهار گزینه ای (N=4) که دارای 100سؤال می باشد. دانش آموزی به 80 سؤال پاسخ داده و از این تعداد 12 سؤال غلط (W=14) و 68 سؤال درسا است (R=68) نمره اصلاح شده این دانش آموز برابر است با:
64= 12 - 68= نمره اصلاح شده
1- 4
تحلیل سؤال های آزمون:
هدف از تحلیل، وارسی تک تک سؤالهای آزمون و تعیین میزان دقت و نارسایی آن است.
مراحل تحلیل سؤال های آزمون:
برای تحلیل سؤال های آزمون باید تعیین کنیم چه تعداد افراد گزینه درست را انتخاب کردند و چه تعدادی گزینه های انحرافی را برگزیدند و چند نفر آن را بی جواب گذاشتند.
برای این منظور، ابتدا دو گروه بالا(قوی) و پایین(ضعیف) را انتخاب می کنیم.
گروه بالا از بین (25% تا 33%) دانش آموزانی که بیشترین نمره را آوردند متخصصان آزمون سازی( از جمله وتینی و سیبرنر1970 و نیکتو 1980) پیشنهاد کردند اگر تعداد کل دانش آموز شرکت کننده بیشتر از 20 یا 40 نفر هستند 10 نفر گروه بالا و 10 نفر گروه پایین انتخاب شوند.
بعد از تهیه گروههای بالا و پایین، لازم است برای هر سوال اطلاعات زیر تهیه شود:
1- تعداد افراد گروه بالا که هر یک از گزینه ها را انتخاب کرده یا آن را بی جواب گذاشتند.
2- تعداد افراد گروه پایین که هر یک از گزینه ها را انتخاب یا آن را بی جواب گذاشتند.
مثال: تهیه کارت و جدول زیر (جدول 2-13 کتاب)
ضریب دشواری: 35
ضریب تمیز:3%
محاسبه ضریب دشواری سؤال:
درصد کل آزمون شوندگانی که به یک سؤال جواب درست می دهند. ضریب دشواری (difficvtty index) آن سؤال است که با حرف P نمایش داده می شود.
ضرییب دشواری عبارتست از:
تعداد کسانی که به سؤال جواب درست دادند =R
تعداد کل آزمون شوندگان=T 100 P=
مثال: اگر از تعداد کل80 نفر شرکت کننده 65نفر به سؤال جواب درست داده باشند ضریب دشواری:
81= -1=P
در مواردی که تعداد شرکت کنندگان زیاد است و اطلاعات محدود است لازم است از فرمول زیر استفاده کنیم:
100× =P
برای مثال جدول قبل : 35=100× =100 × =P
تفسیر ضریب دشواری:
در آزمونهای وابسته به هنجار برای تفسیر ضریب دشواری از آمار استفاده می کنیم.
انتظار ما این است که برای آزمون شوندگان نمراتی که بدست می آید در طول یک پیوستار باشد و هر چه پراکندگی بیشتر باشد بهتر است به عبارت دیگر هر چه واریانس نمرات حاصل از یک آزمون بزرگتر باشد آن آزمون، آزمون بهتری است.
واریانس نمرات گروهی 1- واریانس سؤالها
پاسخ دهند به یک آزمون
از دو قسمت تشکیل شده است 2- همبستگی بین سؤالها
هر سؤالی که دارای واریانس بزرگتری است و با سایر سؤالهای آزمون همبستگی بیشتر دارد آن سؤال قوی تر و بهتر است.
محاسبه واریانس سؤال:
ضریب دشواری=P S=P×(1-P) واریانس
یک سؤال زمانی دارای حداقل واریانس است که ضریب دشواری آن 0 یا 1 باشد بعنی یا همه به آن سؤال پاسخ درست داده باشند. یا هیچکدام پاسخ درست نداده باشند. S=0×(1-0)=0
S=1×(1-1)=0
اما زمانی که ضریب دشواری 50% باشد واریانس حداکثر است.
25%=(5%-1)×5S=%
نتیجه: برای انتخاب یک سؤال برای آزمون، سؤالهایی بهتر هستند که ضریب دشواری آنان بین (1و0) باشد و به 5% نزدیک تر باشد.
محاسبه ضریب تمیز، سؤال:
ضریب تمیز برخلاف ضریب دشواری که سختی یا آسانی سؤال را مشخص می کند. قدرت سؤال را در تمایز یا تشخیص گروه قوی و ضعیف آزمون شوندگان مشخص می کند، یعنی مشخص می کند سؤال تا چه اندازه می تواند گروه قوی و ضعیف را از هم جدا سازد:
=(ضریب تمیز سؤال)
در مثال جدول قبل: 3%= =d
تفسیر ضریب تمیز: هر قدر ضریب تمیز بزرگ باشد، قوه تمیز آن سؤال بیشتر است
1- مثلاً اگر قوه تمیز 9% باشد، آن سؤال آزمون شوندگان قوی و ضعیف را خوب از هم جدا می کند.
2- اما اگر قوه تمیز 10% باشد آن سؤال از عهده جداسازی قوی و ضعیف بر نمی آید.
3- ضریب تمیز صفر یعنی این که سؤال بهیچ وجه نتوانسته بین گروه قوی و ضعیف تمایز ایجاد کند.
4- گاهی اتفاق می افتد ضریب تمیز منفی است یعنی در این سؤال گروه قوی برتر از گروه ضعیف عمل کرده پس این سؤال دارای عیب و اشکال اساسی است و باید تجدید نظر شود.
همبستگی سؤال با کل آزمون:
ضریب تمیز سؤال نوعی ضریب توافق سؤال با کل آزمون است سؤالی که ضریب تمیز آن بالاست همبستگی آن با کل آزمون بیشتر است یعنی اگر در سؤالی افراد قوی(بالا) به آن پاسخ درست داده اند یعنی کسانی کخ نمره شان در کل آزمون بالاست بنابراین آن سؤال با کل آزمون همبسته است.
پس یکی از راههای محاسبه ضریب تمیز سؤالهای یک آزمون محاسبه ضریب همبستگی بین نمره آزمون شوندگان در آن سؤال و نمرات آنان در کل آزمون است.
این ضریب همبستگی به صورت ضریب همبستگی دو رشته ای نقطه ای محاسبه می شود.
1- اگر ضریب همبستگی سؤال با آزمون بیشتر باشد یعنی سؤال با کل آزمون توافق بیشتری دارد.
2- اگر ضریب همبستگی سرال با کل آزمون منفی باشد یعنی سؤال با آزمون ناهمخوانی دارد.
3- اگر ضریب همبستگی سؤال با کل آزمون صفر باشد سرال از ضریب تمیز برخوردار نیست.
همبستگی میان سؤالهای آزمون:
علاوه بر ضریب همبستگی میان سؤال آزمون با کل آزمون ضریب همبستگی تک تک سؤالها را با هم تعیین می کنیم.
فواید این کار
اگر همبستگی بین یک سؤال
و کل آزمون کم باشد
دو دلیل وجود دارد
رابطه بین ضریب دشواری و ضریب تمیز:
8% 6% 4% 2%
سؤال خوب، سؤالی است با ضریب دشواری متوسط و ضریب تمیز بزرگ.
پایان