پیشگیری از «بیرون افتادن» دانشجویان در دوره‌های آنلاین: چگونه به کمک هوش مصنوعی، نوش‌دارو را قبل از مرگ سهراب برسانیم؟

در گذشته‌های دور (!) برای یاد گرفتن درس‌ها در مدرسه یا دانشگاه مجبور بودیم سر کلاس به شکل حضوری شرکت کنیم. به مرور با رشد تکنولوژی (و رویدادهایی مثل پاندمی کووید-۱۹)، شرکت در کلاس‌های آنلاین محبوبیت روزافزون پیدا کرد. بدون شک بسیاری از شما خوانندگان این متن، در کلاس‌های آنلاین پلتفرم‌هایی مثل کورسرا، Udemy یا موارد مشابه شرکت کرده‌اید؛ به چنین پلتفرم‌هایی، به طور کلی، MOOC (مخفف Massive Open Online Course) هم گفته می‌شود. MOOC ها تجربه یادگیری با کیفیت بالا، با سرعت مطلوب هر شخص، و در برخی موارد رایگان را در دسترس میلیون‌ها نفر از سراسر جهان، مستقل از مکان جغرافیایی‌شان، قرار می‌دهند. در چنین پلتفرم‌هایی، دانش‌آموزان و دانشجویان می‌توانند با روندی که خود ترجیح می‌دهند کلاس‌های درس را در زمان و مکان مناسب دنبال کنند و با آرامش کامل به حل تمرین‌ها بپردازند.

با این وجود، یک مانع بزرگ سر راه استفاده از MOOC ها وجود دارد. بدون شک بسیاری از خوانندگان که تجربۀ استفاده از یک MOOC را داشته‌اند، تجربۀ «به پایان نرساندن» یک MOOC را هم داشته‌اند :) نرخ عدم اتمام یا «بیرون افتادن» (dropout rate) بالای دانشجویان در MOOC ها و درصد پایین کسانی که یک MOOC را با موفقیت به اتمام می‌رسانند، مشکل کوچکی نیست، بلکه نمایانگر یک مانع بزرگ در محیط‌های یادگیری آنلاین و نشانگر تفاوت‌های شدید در انگیزۀ دانشجویان برای شرکت در یک MOOC است. آمار dropout rate نگران‌کننده است؛ Onah و همکاران نشان دادند که نرخ به پایان رساندن بسیاری از MOOC ها کم‌تر از ۱۳ درصد است، به این معنا که بیش از ۸۷ درصد دانشجویان، این MOOCها را به پایان نمی‌رسانند. به عنوان مثال، بسیاری از دانشجویان ممکن است صرفا به دلیل داشتن مقداری زمان خالی در برنامۀ خود، در یک MOOC ثبت‌نام کنند، بدون آن‌که علاقۀ شدیدی به موضوع آن درس داشته باشند. برخی دیگر از دانشجویان به هر دلیل از روند درس عقب می‌مانند و پس از انباشته شدن هفته‌ها، انگیزۀ خود برای بازگشت به مسیر اصلی را از دست می‌دهند.

این اتفاقات ممکن است سبب شوند که دانشجویان مطالب درسی MOOC را به پایان نرسانند و در نتیجه زمان و هزینۀ صرف شده برای MOOC هدر برود.

از صحبت‌های فوق نتیجه می‌گیریم که درک چگونگی رخ‌دادن این اتفاق ناگوار، و یافتن راه‌حل‌هایی برای آن، بسیار ضروری است. یک راه‌حل مناسب می‌تواند این باشد که مدرسین و اساتید درس‌های ارائه‌شده بر بستر MOOC بتوانند نشانه‌های دانشجویانی که احتمال dropout بالا دارند را زودتر تشخیص دهند و حمایت لازم را از آن‌ها قبل از این‌که تصمیم به dropout بگیرند، انجام دهند. این حمایت می‌تواند در انواع مختلفی صورت گیرد، از جمله برگزاری کلاس‌های حل تمرین برای کمک به یادگیری مطالب، ارائۀ فیلم‌های مروری بر هفته‌های قبلی، جلسات رفع اشکال و نظایر آن.

تلاش‌های قبلی در راستای پیش‌بینی دانشجویانی که احتمال dropout دارند، از طریق پرسیدن سوال‌های دوره‌ای در قالب نظرسنجی بوده است، اما این روش چالش‌هایی هم‌چون پر نکردن نظرسنجی توسط دانشجویان با انگیزۀ پایین‌تر یا عدم توانایی پاسخ‌دهی صادقانه به سوالات نظرسنجی را به همراه دارد. با این وجود، به دلیل رشد استفاده از پلتفرم‌های آنلاین برای یادگیری، محققین می‌توانند داده‌های دقیقی از چگونگی استفادۀ دانشجویان از پلتفرم MOOC را تجمیع کرده و به کمک مدل‌های یادگیری ماشین، از آن‌ها برای پیش‌بینی dropout دانشجویان استفاده کنند.

بسیاری از تلاش‌ها در این خصوص در دامنۀ کاری «داده‌کاوی آموزشی» (Educational Data Mining) قرار می‌گیرند. محققانی هم‌چون Whitehill و همکاران (۲۰۱۷) در مقالات خود بررسی کردند که چگونه می‌توان از ویژگی‌هایی مانند ردیابی رفتار دیجیتال دانشجویان هنگام دیدن ویدیوهای درس و یا مشارکت آن‌ها در آزمونک‌های درسی برای پیش‌بینی احتمال به پایان رساندن درس‌ها استفاده کرد.

محققین شاخۀ EDM دریافته‌اند که الگوهایی مانند pause های متداول یا بازبینی خارج از برنامۀ فیلم‌های درس، برنامه‌ریزی درسی نامنظم و یا ارسال کردن پاسخ تمرین‌ها با تأخیر می‌توانند نمایانگر مشکلاتی در روند دانشجویان باشند.

یکی از مقالات پژوهشی مهم در این راستا، مقالۀ Swamy و همکاران (۲۰۲۲) در کنفرانس Learning at Scale بوده است که به‌طور خاص، در این نوشتار، بررسی دقیق‌تری روی آن انجام می‌دهیم. یکی از چالش‌های کارهای قبلی، عدم گسترش مدل‌های یاد‌گرفته‌شده روی یک دادگان آموزشی به دادگان‌های دیگر بوده است که سبب می‌شده برای هر MOOC نیاز به یادگیری مدل جدیدی وجود داشته باشد. Swamy و همکاران برای حل این مشکل، اطلاعات فعالیت‌ها (interaction ها)ی دانشجویان با MOOC را با فراداده‌هایی (metadata) در خصوص ویژگی‌های کلی درس ترکیب کردند تا مدلی توسعه دهند که در درس‌ها و موضوعات مختلف قابل‌استفاده باشد. برای این منظور، آن‌ها از تکنیک مرسومی در یادگیری ماشین موسوم به transfer learning استفاده کردند. در این روش، مدل‌های یادگیری ماشین روی دادگان‌های وسیعی از MOOC های قبلی آموزش می‌بینند تا مدل بتواند به جای وابستگی به ویژگی‌های مخصوص به یک درس یا موضوع خاص، الگوهای رفتاری عمومی دانشجویان که در دروس و موضوعات مختلف معتبر هستند را یاد بگیرد.

در مقالۀ مذکور، Swamy و دیگران در ابتدا دادگانی متشکل از ۲۶ دورۀ MOOC ارائه‌شده توسط EPFL شامل اطلاعات بالای ۱۴۵ هزار دانشجو و میلیون‌ها interaction دانشجویان با پلتفرم MOOC را اخذ کردند. سپس، آنان از دادگان خام، «خصوصیات رفتاری» (behavioral features) متعددی را استخراج کردند که هر یک نمایانگر بعد (dimension) متفاوتی از چگونگی تعامل دانشجویان با MOOC مربوطه بوده است. این خصوصیات رفتاری در گروه‌های مختلفی قرار گرفتند که چند نمونه از آنان عبارت‌اند از:

«نظم»: رفتارهای یادگیری دانشجویان تا چه حد منظم است؟
آیا زمان ورود (login) دانشجویان به پلتفرم هر روز یکسان است یا به مرور زمان تغییر می‌کند؟ آیا دانشجویان بیشتر در طول هفته درس می‌خوانند یا آخر هفته؟
«تعامل»: دانشجویان به چه میزان روی موارد مختلف در پلتفرم MOOC کلیک کرده و با آن‌ها تعامل می‌کنند؟ چگونگی این رفتار، چه تفاوت‌هایی بین روزهای هفته و آخر هفته‌ها دارد؟
«رفتار مشاهده فیلم»: آیا دانشجویان فیلم‌ها را از اول تا آخر بدون وقفه تماشا می‌کنند؟ آیا بخش‌های خاصی را skip کرده یا دوباره پخش می‌کنند؟ آیا الگوی مشاهدۀ دانشجویان به صورت پیوسته است یا شامل وقفه، بازپخش یا رد کردن بخش‌هایی از محتواست؟
«مشارکت در آزمون»: آیا دانشجویان در آزمونک‌های درس شرکت کرده‌اند؟ آیا توانسته‌اند در اولین شرکت در آزمونک، آن را با موفقیت بگذرانند؟

علاوه بر موارد فوق که مربوط به خصوصیات رفتاری دانشجویان می‌شود، نویسندگان مقالۀ مذکور، ویژگی‌های فراداده‌ای دیگری را نیز که مربوط به کلیت دروس می‌شود، به لیست ویژگی‌های فوق افزودند، مانند مدت زمان ارائه شدن درس، سطح درس (مبتدی، متوسط، پیشرفته، ...)، زبان درس (انگلیسی یا فرانسوی)، و نیز توضیحات مربوط به درس که با روش‌های پردازش زبان طبیعی (NLP) به ویژگی‌های قابل‌پردازش تبدیل شدند.

تمام ویژگی‌های فوق به یک مدل BiLSTM داده شدند. این مدل نوعی از مدل‌های خانوادۀ بزرگ‌تر RNN هاست که برای تحلیل سری‌های زمانی (time series)، مانند مسئلۀ فوق، می‌توان از آن استفاده کرد (در این نوشتار، از بیان جزئیات معماری مدل و نیز فرآیند fine tuning آن، صرف‌نظر می‌کنیم). ارزیابی مدل در دو مرحله انجام گرفت: پس از تکمیل ۴۰ درصد هر MOOC و پس از تکمیل ۶۰ درصد هر MOOC. به این طریق، نویسندگان دریافتند که آیا می‌توان پیش‌بینی‌ای با دقت کافی از موفقیت یا عدم موفقیت (pass or fail) دانشجویان پس از گذشت ۴۰ یا ۶۰ درصد از بازۀ زمانی یک MOOC داشت یا خیر.

در نهایت، پس از ارزیابی، Swamy و دیگران دریافتند که:

عملکرد مدل در عملیات transfer به ازای هر درس، به تعداد دفعاتی که درس مذکور قبلا ارائه شده، تعداد دانشجویانی که قبلا در درس مذکور مشارکت کرده‌اند، و نرخ به پایان رساندن موفقیت‌آمیز درس توسط آنان بستگی دارد.
ترکیب ویژگی‌های رفتاری دانشجویان (مانند نظم، تعامل و غیره) با ویژگی‌های مختص به هر درس (مانند سطح، زبان و غیره) باعث افزایش کارایی مدل برای دروسی که تا کنون در دادگان حضور نداشته‌اند می‌شود. به طور خاص، ویژگی‌های «سطح درس»، «عنوان درس»، و «مدت زمان درس» برای پیش‌بینی موفقیت‌آمیز dropout در مقاطع اولیه تأثیر قابل‌توجهی دارند.

مقالۀ Swamy و دیگران نشان می‌دهد که ویژگی‌های قابل جمع‌آوری از یک پلتفرم MOOC توانایی پیش‌بینی نرخ dropout دانشجویان را دارند. اهمیت تحقیقاتی مانند این مقاله، تنها در پیش‌بینی dropout نیست، بلکه یافته‌های این مقاله، نویدبخش آن هستند که اساتید دروس می‌توانند در موقع لازم برای دانشجویانی که خطر dropout را دارند وارد عمل شده و در صورت تمایل از این اتفاق جلوگیری کنند. به‌عنوان مثال، فرض کنید که در یک MOOC، دستیار مجهز به هوش مصنوعی تشخیص می‌دهد که دانشجوی به خصوصی احتمال dropout دارد (مثلا از طریق الگوهای یادگیری نامنظم یا تحویل ندادن تمرین‌ها و شرکت نکردن در آزمونک‌ها). این دستیار مجهز به هوش مصنوعی می‌تواند اساتید درس را از این حقیقت آگاه کرده و به آن‌ها پیشنهادهایی برای کمک به دانشجویان دهد (به عنوان مثال، کلاس‌های رفع اشکال یا انگیزه‌بخشی به دانشجویان). این «دخالت‌ها» (interventions) در روند درس می‌توانند به افزایش نرخ گذراندن موفقیت‌آمیز MOOC ها توسط دانشجویان کمک ویژه‌ای کنند.

آن‌چه تا این‌جا دیدیم، نشان می‌دهد که هوش مصنوعی و داده‌کاوی آموزشی می‌توانند نقشی کلیدی در شناسایی و پیشگیری از dropout در دوره‌های آنلاین ایفا کنند. به کمک تحلیل داده‌های رفتاری دانشجویان و درک الگوهای تعامل آن‌ها با پلتفرم، می‌توان پیش از آن‌که دانشجو از مسیر یادگیری خارج شود، وارد عمل شد و حمایت لازم را فراهم کرد. به زبان ساده‌تر، چنین سامانه‌هایی مانند نوشداروهای پیش‌گیرانه عمل می‌کنند: یک پزشک ماهر، لزوما منتظر نمی‌ماند تا بیماری به مرحلۀ اوج خود برسد و سپس درمان را آغاز کند، بلکه به دنبال نشانه‌های اولیه از احتمال بروز بیماری می‌گردد تا بتواند در زمان مناسب در روند گسترش بیماری «دخالت» کند. به‌طرز مشابه، اساتید دروس نیز می‌توانند مدل‌های یادگیری ماشین پیش‌بینی dropout دانشجویان را به عنوان نوعی از «داروی آموزشی» به کار گیرند و با دخالت در زمان مناسب، اطمینان حاصل کنند که دانشجو از منظر دچار «بیماری درسی» نمی‌شود.

با این حال، استفاده از این ابزارها و مدل‌ها، تنها بخشی از راه‌حل است. طراحی مداخلات مؤثر، تعامل انسانی معنادار میان استاد و دانشجو و ایجاد حس تعلق در کلاس‌های آنلاین از دیگر عوامل مهمی هستند که باید در کنار ابزارهای هوشمند استفاده شوند تا مسیر موفقیت دانشجویان هموار شود. اگر بتوانیم سامانه‌هایی بسازیم که به موقع به اساتید و دانشجویان هشدار دهند، پشتیبانی فراهم کنند و به نیازهای فردی هر دانشجو پاسخ مناسب دهند، آن‌گاه می‌توانیم امیدوار باشیم که درصد بیشتری از دانشجویان، مسیر یادگیری خود را با موفقیت و بدون مشکل به پایان برسانند.