banner
Centro notizie
Articolato e competente nelle loro competenze.

La modellazione condivisa può aiutare le scuole a prevedere ed evitare gli abbandoni

Aug 02, 2023

Un gruppo di ricerca co-guidato da Cornell ha scoperto che per le scuole senza le risorse per condurre analisi dell’apprendimento per aiutare gli studenti ad avere successo, la modellazione basata su dati di altre istituzioni può funzionare altrettanto bene della modellazione locale, senza sacrificare l’equità.

"Per utilizzare modelli basati sui dati, sono necessari dati", ha affermato Rene Kizilcec, assistente professore di scienza dell'informazione presso il Cornell Ann S. Bowers College of Computing and Information Science. "E in molte scuole, soprattutto quelle con risorse limitate che trarrebbero maggiori benefici dalle applicazioni di analisi dell'apprendimento, i dati sono raramente accessibili."

Kizilcec è un autore senior del libro "Cross-Institutional Transfer Learning for Educational Models: Implications for Model Performance, Fairness, and Equity", che sarà presentato alla conferenza dell'Association for Computing Machinery on Fairness, Accessibility and Transparency (ACM FAccT), il 12 giugno -15 a Chicago. L'autore principale è Josh Gardner, dottorando in informatica presso l'Università di Washington.

Kizilcec e il suo team hanno utilizzato dati anonimi provenienti da quattro università statunitensi e li hanno convertiti in una struttura comune allo scopo di modellare quali studenti potrebbero abbandonare il college. Solo i modelli specifici dell’università – nessun dato individuale degli studenti, che solleva problemi di privacy – sono stati condivisi tra i membri del gruppo di ricerca.

Ogni anno negli Stati Uniti più di 1 milione di studenti abbandonano l’università; hanno 100 volte più probabilità di non pagare il prestito studentesco rispetto a coloro che si laureano. Ciò ha portato il governo federale a imporre norme che incentivano i college e le università a ridurre gli abbandoni, richiedendo loro di segnalare i tassi di abbandono, nonché classifiche che tengano conto dei tassi di conseguimento del diploma.

Kizilcec ha affermato che le principali istituzioni hanno le risorse per condurre analisi predittive dei dati. Ma le istituzioni che potrebbero trarre maggiori benefici da questi dati – college più piccoli o istituti biennali – in genere non lo fanno.

"Devono fare affidamento sui servizi di alcune aziende che offrono prodotti di analisi educativa". Egli ha detto. "Le istituzioni possono costruire i propri modelli - un processo molto costoso - o acquistare una "soluzione" di analisi, con una modellazione che viene generalmente eseguita esternamente sui dati di altre istituzioni. La domanda è se questi modelli esterni possono funzionare altrettanto bene dei modelli locali, e se introducono pregiudizi."

L'obiettivo del lavoro dei ricercatori era una previsione accurata della "ritenzione", ovvero se ogni studente che entra in un istituto per la prima volta in autunno si iscriverebbe allo stesso istituto l'autunno successivo.

Per valutare il successo del trasferimento di apprendimento – prendendo informazioni da un istituto e utilizzandole per prevedere i risultati in un altro – il team ha utilizzato tre approcci:

I ricercatori hanno utilizzato i tre metodi di trasferimento, insieme alla modellizzazione locale in ciascuna delle quattro istituzioni, al fine di valutare la validità dell'apprendimento basato sul trasferimento. Com'era prevedibile, i modelli locali hanno fatto un lavoro migliore nel prevedere i tassi di abbandono, "ma non tanto quanto avremmo pensato, francamente, data la differenza tra le quattro istituzioni in termini di dimensioni, tassi di conseguimento del diploma e dati demografici degli studenti", ha detto Kizilcec.

E in termini di equità – la capacità di ottenere prestazioni predittive equivalenti tra sottogruppi di sesso e razza – la modellazione ha funzionato bene senza sacrificare l’equità.

Kizilcec ha affermato che i risultati del suo team indicano una maggiore equità nella previsione dell'abbandono scolastico, il che potrebbe aiutare le scuole con risorse inferiori con un intervento precoce e prevenire l'abbandono degli studenti, che costa all'istituto e può portare a risultati peggiori per gli studenti.

"Dopotutto potrebbe non essere necessario stanziare risorse per creare modelli locali in ogni singola scuola", ha affermato. "Possiamo utilizzare le informazioni provenienti dalle scuole che dispongono di infrastrutture dati e competenze per offrire analisi preziose alle scuole senza queste risorse e senza sacrificare l'equità. Questo è un risultato promettente per i dirigenti scolastici e i responsabili politici."

Altri contributori sono Christopher Brooks, assistente professore presso la School of Information dell'Università del Michigan; Renzhe Yu, assistente professore di analisi dell'apprendimento e data mining educativo presso la Columbia University; e Quan Nguyen, docente di scienza dei dati presso l'Università della British Columbia.