پژوهش های انجام شده درباره : طراحی و کاربرد الگوهای تهیه‌ی خزانه‌ی‌ سؤال در بهینه سازی کارکرد سنجش انطباقی ...

ارسال شده در 9 آبان 1400 توسط نجفی زهرا در بدون موضوع

۶۲۴۵/۱ تا ۶۲۴۵/۱-

۱۲۶۰/۰

۰۱۶۱/۰

۸۴۶/۶۱

۵/۲ تا ۶۲۴۵/۱ & 5/2- تا ۶۲۴۵/۱-

۱۲۸۹/۰

۰۱۷۲/۰

۱۲۲/۶۰

۴ تا ۵/۲ & 4- تا ۵/۲-

۱۳۳/۰

۰۱۷۸/۰

۱۳۲/۵۶

نمودار ۳-۱: مراحل شبیه‌سازی سنجش انطباقی کامپیوتری
نمودار ۳-۲: میزان آگاهی فراهم شده بوسیله‌ی یک سؤال که بر اساس مدل راش مدرج شده است.
نمودار ۳-۳: نمونه‌ای از تصویر ab-bin یا ab-block

نمودار ۳-۴: توزیع جمعیت برای نمونه ۵۰۰ نفری ( در بازه ۴- تا ۴) با فواصل ۱۲۵/۰

نمودار ۳-۵: توزیع جمعیت برای نمونه ۶۰۰۰ نفری ( در بازه ۴- تا ۴) با فواصل ۱۲۵/۰
فصل چهارم
تجزیه و تحلیل یافته‌های پژوهش
تجزیه و تحلیل یافتههای پژوهش
مقدمه
در این فصل اطلاعات مربوط به شبیه‌سازی خزانه‌های سؤال بهینه و نتایج داده‌های بدست آمده از اجراهای واقعی CAT مورد بررسی قرار خواهد گرفت.
این قسمت از دو بخش عمده تشکیل شده است. در بخش اول، روش شبیه‌سازی مونت کارلو ریکیسی (۲۰۰۳) در مورد شبیه‌سازی خزانه‌ی سؤال بهینه بر اساس مدل راش مورد بررسی قرار می‌گیرد. این بخش به منظور مفهوم‌سازی رویکرد اکتشافی ریکیسی (بر اساس روش bin-and-union ) در طراحی خزانه‌ی سؤال بهینه، در مورد آزمون CAT که تک محتوایی است و هیچ گونه روش کنترل مواجهه‌ بیش از حد سؤال بر آن اعمال نمی‌شود و پهنای b-bin ها برابر با ۲/۰ است، شبیه‌سازی می‌شود، تا از این طریق منطق و زیربنای این شبیه سازی به صورت کامل در مدل تک پارامتری راش، شرح داده شود. در قسمت دوم ویژگی‌های مربوط به خزانه‌های سؤال بهینه‌ی شبیه‌سازی شده بر اساس مدل سه پارامتری (قابل تعمیم به مدل دو پارامتری نیز می‌باشد)، شامل؛ اندازه‌ی خزانه‌ی سؤال، ویژگی‌های آماری و غیر آماری خزانه‌ها مورد بررسی قرار می‌گیرد. همچنین، عملکرد خزانه‌های سؤال شبیه‌سازی شده با عملکرد خزانه‌ی سؤال عملیاتی مقایسه می‌شود، این عملکردها از طریق ملاک‌های ارزیابی خزانه‌ی سؤال شامل، میانگین آگاهی آزمون در هر سطح ، سوگیری یا بایاس، میانگین مجذور خطا (MSE)، به منظور سنجش دقت برآورد ، میزان چولگی یا کجی توزیع نرخ مواجهه‌ سؤال، درصد سؤالات بیش مواجهه شده، نرخ همپوشی سؤال و درصد سؤالات کم مواجهه شده، به منظور محاسبه‌ی شاخص امنیت آزمون، مورد ارزیابی قرار می‌گیرد (چانگ و یینگ، ۱۹۹۹ ؛ ریکیسی ۲۰۰۵).
در این فصل نتایج بدست آمده از اجرای شبیه‌سازی های صورت گرفته برای ساخت خزانه‌های سؤال بهینه در ۱۸ طرح متنوع گزارش می‌شود، سپس، نتایج حاصل از هر یک از طرح‌ها با یک خزانه‌ی سؤال عملیاتی مقایسه خواهد شد.
در این فصل ذکر چندین نکته قبل از گزارش نتایج ضرورت دارد:
از این پس به خزانه‌های سؤال بهینه‌ای که بر اساس روش bin-and-union ایجاد می‌شود، بر اساس اختصار ROP (range-optimal item pool) گفته خواهد شد. این اختصار از پژوهش‌ ریکیسی و هی( b 2009) گرفته شده است.
همچنین، خزانه‌ی سؤال عملیاتی به صورت اختصار، OP (operational item pool) بیان می‌شوند، این اصطلاح از پژوهش گو و ریکیسی (۲۰۰۷) گرفته شده است.
با دستکاری چهار عامل: روش ایجاد سؤال بهینه (R، MRP، MTI)، پهنای b-bin (2/0 و ۴/۰)، کنترل و یا عدم کنترل مواجهه بیش از حد سؤال، در نظر گرفتن و یا نگرفتن تعادل محتوای در CAT، ۱۸ خزانه‌ی سؤال بهینه یا (ROP_1, ROP_2, ROP_3, …, ROP_18) ایجاد شد. که در جدول ۴-۱ آورده شده است.
لازم به ذکر است که آزمون ریاضی CAT عملیاتی شامل دو بخش است، یک بخش، آزمون ۲۰ سؤالی که در آن تعادل محتوای سؤالات ارائه شده، در نظر گرفته نشده است (این آزمون تنها به منظور اهداف پژوهشی بر روی نمونه‌ای معرف از جامعه‌ی مورد نظر اجرا شد). و بخش دوم، یک آزمون ۶۰ سؤالی که در آن محتوای سؤالات آزمون دارای اهمیت می‌باشد. آزمون ۶۰سؤالی دارای وزن محتوایی ثابت برای همه‌ی آزمودنی‌ها می‌باشد، یعنی شامل، ۲۵ سؤال حسابان (arithmetic)، ۱۵ سؤال جبر خطی (algebra) و ۲۰ سؤال هندسه (geometry) می‌باشد. هر یک از این دو قسمت، به صورت مجزا در نمونه‌های همتایی (۳۵۰ نفری) از جامعه‌ی دانش‌آموزان مقطع پیش‌دانشگاهی به صورت آنلاین اجرا شد.
همچنین، نتایج ساخت خزانه‌های سؤال سه پارامتری برای CAT ، با در نظر گرفتن تعادل محتوایی و بدون تعادل محتوایی، دارای تعداد سؤالات متفاوتی است، از این‌رو، در این پژوهش این هدف وجود ندارد که نتایج این دو قسمت با یکدیگر مقایسه شود زیرا، تعداد سؤالات متفاوتی را شامل می‌شوند. بنابراین، در این فصل، برای طراحی خزانه‌های سؤال بهینه بر اساس مدل سه پارامتری دو تقسیم بندی کلی وجود دارد، یکی از آنها تحت عنوان، خزانه‌های سؤال بدون در نظر گرفتن تعادل محتوایی و دیگری، خزانه‌های سؤال با در نظر گرفتن تعادل محتوایی می‌باشد.
تقسیم بندی دیگری که در طراحی خزانه‌های سؤال در نظر گرفته شد، عامل مواجهه‌ سؤال است.
همچنین، از آنجا که پهنای b-bin ها، یکی از عوامل مهم در دقت اندازه‌گیری خزانه‌ی ایجاد شده، می‌باشد و بر وپژگی‌هایی همچون تعداد سؤال و توزیع پارامترهای سؤالات نیز تاثیر می‌گذارد، دو پهنای ۲/۰ و ۴/۰ که به ترتیب برابر با ۹۶/۰ . ۹۹/۰ دقت اندازه‌گیری می‌باشند، با یک میزان ثابت در دامنه‌ی تغییر پارامتر a یا تغییر در بیشینه‌ی آگاهی برابر با ۴/۰، وارد تحلیل می‌شوند.
جدول ۴-۱: طرح‌های خزانه‌ی سؤال شبیه‌سازی شده

مجله علمی و آموزشی نواندیش

آخرین مطالب

مجله علمی و آموزشی نواندیش

جستجو

موضوعات

فیدهای XML