L'obiettivo di questo lavoro è quello di proporre una misura di populismo graduato ottenuta con il Supervised Machine Learning. Tale misura potrà essere impiegata per costruire variabili dipendenti pesate utilizzabili nelle analisi empiriche sulla domanda di populismo. L'assunto è che una misura continua consenta una migliore conoscenza del contesto politico. Il dataset è costituito da oltre 200 manifesti elettorali rappresentativi dei contesti partitici dei seguenti paesi: Italia, Francia, Spagna, Austria, Germania e Paesi Bassi. Ho già sviluppato una prima misura sulla base di training separati per ciascun paese, ottenendo risultati promettenti e stabili. L'indicatore è stato finora applicato alle analisi nazionali preliminari, testandolo anche in analisi cross-country attraverso la clusterizzazione di partiti politici che presentano punteggi simili. Tuttavia, in una prospettiva transnazionale, è necessario sviluppare un indicatore di populismo adatto all'analisi tra paesi e all'interno dei paesi, ottenuto attraverso un training globale a partire da una singola lingua. Ciò consentirebbe di classificare i partiti secondo una misura unificata, ottenendo score più precisi e dettagliati che possano condurre alla costruzione di variabili dipendenti ancora più rappresentative del contesto partitico in esame. Il ricorso a strumenti di traduzione automatica pone però questioni relative alla precisione dei testi tradotti. Un ampio margine di errore potrebbe, difatti, ridurre la bontà dei risultati ottenuti nelle analisi o inserirvi bias formali. Pertanto, l'obiettivo è quello di effettuare tre diverse traduzioni del dataset in tre lingue per poi verificare la consistenza e l'affidabilità degli score ottenuti dopo i tre training globali. Se i risultati ottenuti saranno consistenti tra loro, sarà dunque possibile adottare il nuovo score di populismo nelle analisi cross-country. In caso contrario, si potrà continuare a lavorare per approssimazione con i training nazionali.
Da un punto di vista di innovatività della ricerca, il mio lavoro si distingue per l'utilizzo di strumenti presi in prestito dalle scienze computazionali e per l'impiego di un dataset di programmi elettorali molto più completo e aggiornato rispetto a quelli presenti in rete. Queste due caratteristiche rendono gli effetti della ricerca particolarmente significativi in termini di avanzamento delle conoscenze rispetto allo stato dell'arte, poiché fondati su risultati più completi, attendibili, riproducibili e maggiormente oggettivi rispetto a quelli finora presenti in letteratura.
La natura stessa del nuovo indicatore è foriera di innovazione e avanzamento. In particolare l¿adozione del metodo basato sul machine learning supervisionato consente di ottenere una misura di populismo continua caratterizzata da una sua coerenza e riproducibilità, a differenza di molte classificazioni precedenti. Tale misura può costituire uno strumento utile per un migliore studio dei partiti nel tempo e nei diversi contesti nazionali, tenendo anche conto della natura camaleontica del populismo. Difatti, a una misura di populismo più precisa possono corrispondere analisi della domanda più rifinite, in cui viene riconosciuta all'elettorato - non più diviso in maniera netta tra i sostenitori dei cosiddetti partiti populisti e non - una certa gradualità. Pertanto, elettori di partiti mainstream potranno comunque risultare sensibili alle ricette populiste, ovvero potranno esserci elettori solo parzialmente populisti le cui attitudini resterebbero ignorate nelle analisi tradizionali basate su variabili dipendenti dicotomiche.
Inoltre, questa misura di populismo si presta particolarmente ad essere impiegate nelle analisi cross-country e nel tempo perché fornisce indicazioni precise ed attendibili riferite soprattutto al fenomeno dell¿anti-elitismo. Permette infatti di aggiungere un ulteriore tassello alla ricerca sui comportamenti dei partiti e degli elettori, consentendo oltre all¿analisi del populismo, uno studio più sistematico dei partiti che sicuramente si distinguono come avversi al populismo (riconoscibili perché caratterizzati da score di populismo molto bassi). Sicuramente, a differenza delle tecniche di analisi del testo basate sull'annotazione umana, l'utilizzo di un algoritmo di machine learning contribuisce in maniera importante alla riduzione, se non all'eliminazione, di molti bias formali che accompagnano gli studi del settore, assicurando anche una certa consistenza dei valori nel tempo.
Infine, le variabili dipendenti "pesate", costruite proprio a partire dagli score ottenuti per partito e per anno, possono essere facilmente utilizzate sia in caso di multinomial logit che in caso di ordered logit, fornendo spunti interessanti sui predittori del voto populista e non populista tra gli elettori. Certo è che l'utilizzo di una misura di populismo globale potrebbe costituire un ulteriore avanzamento poiché, in una prospettiva cross-country, fornirebbe un'analisi dell'offerta e della domanda più precisa e dettagliata, oltre a contribuire al dibattito sull'utilizzo di strumenti di traduzione automatica nelle analisi scientifiche.