پیشگیری از «بیرون افتادن» دانشجویان در دورههای آنلاین: چگونه به کمک هوش مصنوعی، نوشدارو را قبل از مرگ سهراب برسانیم؟
در گذشتههای دور (!) برای یاد گرفتن درسها در مدرسه یا دانشگاه مجبور بودیم سر کلاس به شکل حضوری شرکت کنیم. به مرور با رشد تکنولوژی (و رویدادهایی مثل پاندمی کووید-۱۹)، شرکت در کلاسهای آنلاین محبوبیت روزافزون پیدا کرد. بدون شک بسیاری از شما خوانندگان این متن، در کلاسهای آنلاین پلتفرمهایی مثل کورسرا، Udemy یا موارد مشابه شرکت کردهاید؛ به چنین پلتفرمهایی، به طور کلی، MOOC (مخفف Massive Open Online Course) هم گفته میشود. MOOC ها تجربه یادگیری با کیفیت بالا، با سرعت مطلوب هر شخص، و در برخی موارد رایگان را در دسترس میلیونها نفر از سراسر جهان، مستقل از مکان جغرافیاییشان، قرار میدهند. در چنین پلتفرمهایی، دانشآموزان و دانشجویان میتوانند با روندی که خود ترجیح میدهند کلاسهای درس را در زمان و مکان مناسب دنبال کنند و با آرامش کامل به حل تمرینها بپردازند.
با این وجود، یک مانع بزرگ سر راه استفاده از MOOC ها وجود دارد. بدون شک بسیاری از خوانندگان که تجربۀ استفاده از یک MOOC را داشتهاند، تجربۀ «به پایان نرساندن» یک MOOC را هم داشتهاند :) نرخ عدم اتمام یا «بیرون افتادن» (dropout rate) بالای دانشجویان در MOOC ها و درصد پایین کسانی که یک MOOC را با موفقیت به اتمام میرسانند، مشکل کوچکی نیست، بلکه نمایانگر یک مانع بزرگ در محیطهای یادگیری آنلاین و نشانگر تفاوتهای شدید در انگیزۀ دانشجویان برای شرکت در یک MOOC است. آمار dropout rate نگرانکننده است؛ Onah و همکاران نشان دادند که نرخ به پایان رساندن بسیاری از MOOC ها کمتر از ۱۳ درصد است، به این معنا که بیش از ۸۷ درصد دانشجویان، این MOOCها را به پایان نمیرسانند. به عنوان مثال، بسیاری از دانشجویان ممکن است صرفا به دلیل داشتن مقداری زمان خالی در برنامۀ خود، در یک MOOC ثبتنام کنند، بدون آنکه علاقۀ شدیدی به موضوع آن درس داشته باشند. برخی دیگر از دانشجویان به هر دلیل از روند درس عقب میمانند و پس از انباشته شدن هفتهها، انگیزۀ خود برای بازگشت به مسیر اصلی را از دست میدهند.
این اتفاقات ممکن است سبب شوند که دانشجویان مطالب درسی MOOC را به پایان نرسانند و در نتیجه زمان و هزینۀ صرف شده برای MOOC هدر برود.
از صحبتهای فوق نتیجه میگیریم که درک چگونگی رخدادن این اتفاق ناگوار، و یافتن راهحلهایی برای آن، بسیار ضروری است. یک راهحل مناسب میتواند این باشد که مدرسین و اساتید درسهای ارائهشده بر بستر MOOC بتوانند نشانههای دانشجویانی که احتمال dropout بالا دارند را زودتر تشخیص دهند و حمایت لازم را از آنها قبل از اینکه تصمیم به dropout بگیرند، انجام دهند. این حمایت میتواند در انواع مختلفی صورت گیرد، از جمله برگزاری کلاسهای حل تمرین برای کمک به یادگیری مطالب، ارائۀ فیلمهای مروری بر هفتههای قبلی، جلسات رفع اشکال و نظایر آن.
تلاشهای قبلی در راستای پیشبینی دانشجویانی که احتمال dropout دارند، از طریق پرسیدن سوالهای دورهای در قالب نظرسنجی بوده است، اما این روش چالشهایی همچون پر نکردن نظرسنجی توسط دانشجویان با انگیزۀ پایینتر یا عدم توانایی پاسخدهی صادقانه به سوالات نظرسنجی را به همراه دارد. با این وجود، به دلیل رشد استفاده از پلتفرمهای آنلاین برای یادگیری، محققین میتوانند دادههای دقیقی از چگونگی استفادۀ دانشجویان از پلتفرم MOOC را تجمیع کرده و به کمک مدلهای یادگیری ماشین، از آنها برای پیشبینی dropout دانشجویان استفاده کنند.
بسیاری از تلاشها در این خصوص در دامنۀ کاری «دادهکاوی آموزشی» (Educational Data Mining) قرار میگیرند. محققانی همچون Whitehill و همکاران (۲۰۱۷) در مقالات خود بررسی کردند که چگونه میتوان از ویژگیهایی مانند ردیابی رفتار دیجیتال دانشجویان هنگام دیدن ویدیوهای درس و یا مشارکت آنها در آزمونکهای درسی برای پیشبینی احتمال به پایان رساندن درسها استفاده کرد.
محققین شاخۀ EDM دریافتهاند که الگوهایی مانند pause های متداول یا بازبینی خارج از برنامۀ فیلمهای درس، برنامهریزی درسی نامنظم و یا ارسال کردن پاسخ تمرینها با تأخیر میتوانند نمایانگر مشکلاتی در روند دانشجویان باشند.
یکی از مقالات پژوهشی مهم در این راستا، مقالۀ Swamy و همکاران (۲۰۲۲) در کنفرانس Learning at Scale بوده است که بهطور خاص، در این نوشتار، بررسی دقیقتری روی آن انجام میدهیم. یکی از چالشهای کارهای قبلی، عدم گسترش مدلهای یادگرفتهشده روی یک دادگان آموزشی به دادگانهای دیگر بوده است که سبب میشده برای هر MOOC نیاز به یادگیری مدل جدیدی وجود داشته باشد. Swamy و همکاران برای حل این مشکل، اطلاعات فعالیتها (interaction ها)ی دانشجویان با MOOC را با فرادادههایی (metadata) در خصوص ویژگیهای کلی درس ترکیب کردند تا مدلی توسعه دهند که در درسها و موضوعات مختلف قابلاستفاده باشد. برای این منظور، آنها از تکنیک مرسومی در یادگیری ماشین موسوم به transfer learning استفاده کردند. در این روش، مدلهای یادگیری ماشین روی دادگانهای وسیعی از MOOC های قبلی آموزش میبینند تا مدل بتواند به جای وابستگی به ویژگیهای مخصوص به یک درس یا موضوع خاص، الگوهای رفتاری عمومی دانشجویان که در دروس و موضوعات مختلف معتبر هستند را یاد بگیرد.
در مقالۀ مذکور، Swamy و دیگران در ابتدا دادگانی متشکل از ۲۶ دورۀ MOOC ارائهشده توسط EPFL شامل اطلاعات بالای ۱۴۵ هزار دانشجو و میلیونها interaction دانشجویان با پلتفرم MOOC را اخذ کردند. سپس، آنان از دادگان خام، «خصوصیات رفتاری» (behavioral features) متعددی را استخراج کردند که هر یک نمایانگر بعد (dimension) متفاوتی از چگونگی تعامل دانشجویان با MOOC مربوطه بوده است. این خصوصیات رفتاری در گروههای مختلفی قرار گرفتند که چند نمونه از آنان عبارتاند از:
- «نظم»: رفتارهای یادگیری دانشجویان تا چه حد منظم است؟
- آیا زمان ورود (login) دانشجویان به پلتفرم هر روز یکسان است یا به مرور زمان تغییر میکند؟ آیا دانشجویان بیشتر در طول هفته درس میخوانند یا آخر هفته؟
- «تعامل»: دانشجویان به چه میزان روی موارد مختلف در پلتفرم MOOC کلیک کرده و با آنها تعامل میکنند؟ چگونگی این رفتار، چه تفاوتهایی بین روزهای هفته و آخر هفتهها دارد؟
- «رفتار مشاهده فیلم»: آیا دانشجویان فیلمها را از اول تا آخر بدون وقفه تماشا میکنند؟ آیا بخشهای خاصی را skip کرده یا دوباره پخش میکنند؟ آیا الگوی مشاهدۀ دانشجویان به صورت پیوسته است یا شامل وقفه، بازپخش یا رد کردن بخشهایی از محتواست؟
- «مشارکت در آزمون»: آیا دانشجویان در آزمونکهای درس شرکت کردهاند؟ آیا توانستهاند در اولین شرکت در آزمونک، آن را با موفقیت بگذرانند؟
علاوه بر موارد فوق که مربوط به خصوصیات رفتاری دانشجویان میشود، نویسندگان مقالۀ مذکور، ویژگیهای فرادادهای دیگری را نیز که مربوط به کلیت دروس میشود، به لیست ویژگیهای فوق افزودند، مانند مدت زمان ارائه شدن درس، سطح درس (مبتدی، متوسط، پیشرفته، ...)، زبان درس (انگلیسی یا فرانسوی)، و نیز توضیحات مربوط به درس که با روشهای پردازش زبان طبیعی (NLP) به ویژگیهای قابلپردازش تبدیل شدند.
تمام ویژگیهای فوق به یک مدل BiLSTM داده شدند. این مدل نوعی از مدلهای خانوادۀ بزرگتر RNN هاست که برای تحلیل سریهای زمانی (time series)، مانند مسئلۀ فوق، میتوان از آن استفاده کرد (در این نوشتار، از بیان جزئیات معماری مدل و نیز فرآیند fine tuning آن، صرفنظر میکنیم). ارزیابی مدل در دو مرحله انجام گرفت: پس از تکمیل ۴۰ درصد هر MOOC و پس از تکمیل ۶۰ درصد هر MOOC. به این طریق، نویسندگان دریافتند که آیا میتوان پیشبینیای با دقت کافی از موفقیت یا عدم موفقیت (pass or fail) دانشجویان پس از گذشت ۴۰ یا ۶۰ درصد از بازۀ زمانی یک MOOC داشت یا خیر.
در نهایت، پس از ارزیابی، Swamy و دیگران دریافتند که:
- عملکرد مدل در عملیات transfer به ازای هر درس، به تعداد دفعاتی که درس مذکور قبلا ارائه شده، تعداد دانشجویانی که قبلا در درس مذکور مشارکت کردهاند، و نرخ به پایان رساندن موفقیتآمیز درس توسط آنان بستگی دارد.
- ترکیب ویژگیهای رفتاری دانشجویان (مانند نظم، تعامل و غیره) با ویژگیهای مختص به هر درس (مانند سطح، زبان و غیره) باعث افزایش کارایی مدل برای دروسی که تا کنون در دادگان حضور نداشتهاند میشود. به طور خاص، ویژگیهای «سطح درس»، «عنوان درس»، و «مدت زمان درس» برای پیشبینی موفقیتآمیز dropout در مقاطع اولیه تأثیر قابلتوجهی دارند.
مقالۀ Swamy و دیگران نشان میدهد که ویژگیهای قابل جمعآوری از یک پلتفرم MOOC توانایی پیشبینی نرخ dropout دانشجویان را دارند. اهمیت تحقیقاتی مانند این مقاله، تنها در پیشبینی dropout نیست، بلکه یافتههای این مقاله، نویدبخش آن هستند که اساتید دروس میتوانند در موقع لازم برای دانشجویانی که خطر dropout را دارند وارد عمل شده و در صورت تمایل از این اتفاق جلوگیری کنند. بهعنوان مثال، فرض کنید که در یک MOOC، دستیار مجهز به هوش مصنوعی تشخیص میدهد که دانشجوی به خصوصی احتمال dropout دارد (مثلا از طریق الگوهای یادگیری نامنظم یا تحویل ندادن تمرینها و شرکت نکردن در آزمونکها). این دستیار مجهز به هوش مصنوعی میتواند اساتید درس را از این حقیقت آگاه کرده و به آنها پیشنهادهایی برای کمک به دانشجویان دهد (به عنوان مثال، کلاسهای رفع اشکال یا انگیزهبخشی به دانشجویان). این «دخالتها» (interventions) در روند درس میتوانند به افزایش نرخ گذراندن موفقیتآمیز MOOC ها توسط دانشجویان کمک ویژهای کنند.
آنچه تا اینجا دیدیم، نشان میدهد که هوش مصنوعی و دادهکاوی آموزشی میتوانند نقشی کلیدی در شناسایی و پیشگیری از dropout در دورههای آنلاین ایفا کنند. به کمک تحلیل دادههای رفتاری دانشجویان و درک الگوهای تعامل آنها با پلتفرم، میتوان پیش از آنکه دانشجو از مسیر یادگیری خارج شود، وارد عمل شد و حمایت لازم را فراهم کرد. به زبان سادهتر، چنین سامانههایی مانند نوشداروهای پیشگیرانه عمل میکنند: یک پزشک ماهر، لزوما منتظر نمیماند تا بیماری به مرحلۀ اوج خود برسد و سپس درمان را آغاز کند، بلکه به دنبال نشانههای اولیه از احتمال بروز بیماری میگردد تا بتواند در زمان مناسب در روند گسترش بیماری «دخالت» کند. بهطرز مشابه، اساتید دروس نیز میتوانند مدلهای یادگیری ماشین پیشبینی dropout دانشجویان را به عنوان نوعی از «داروی آموزشی» به کار گیرند و با دخالت در زمان مناسب، اطمینان حاصل کنند که دانشجو از منظر دچار «بیماری درسی» نمیشود.
با این حال، استفاده از این ابزارها و مدلها، تنها بخشی از راهحل است. طراحی مداخلات مؤثر، تعامل انسانی معنادار میان استاد و دانشجو و ایجاد حس تعلق در کلاسهای آنلاین از دیگر عوامل مهمی هستند که باید در کنار ابزارهای هوشمند استفاده شوند تا مسیر موفقیت دانشجویان هموار شود. اگر بتوانیم سامانههایی بسازیم که به موقع به اساتید و دانشجویان هشدار دهند، پشتیبانی فراهم کنند و به نیازهای فردی هر دانشجو پاسخ مناسب دهند، آنگاه میتوانیم امیدوار باشیم که درصد بیشتری از دانشجویان، مسیر یادگیری خود را با موفقیت و بدون مشکل به پایان برسانند.