L'esclusione sociale è un concetto polisemico e articolato del quale in letteratura non esiste una definizione univoca: esso sfugge ad una chiara delimitazione, ma soprattutto muta nel tempo, con inevitabili ricadute sulle procedure operative e sugli indici progettati per l'analisi empirica.
Il presente progetto nasce da una necessità conoscitiva in ambito socioeconomico volta da individuare empiricamente una tipologia multidimensionale di "esclusione sociale" in un'ottica nazionale e transnazionale.
In particolare, a partire dall'insieme dei microdati dell'indagine EU SILC "Reddito e condizioni di vita", sui quali sono costruiti i principali indicatori di disuguaglianza sociale e di esclusione sociale, ci si pone l'obiettivo di individuare tipologie di esclusione sociale sia in termini di dimensioni rilevanti che di gruppi di individui.
Tenuto conto che i dati in questione sono dati a struttura complessa del tipo (unità x variabili x occasioni) che non solo, quindi, presentano la classica struttura multivariata (unità x variabili) ma incorporano informazioni aggiuntive legate alla particolare situazione osservazionale di rilevazione (le occasioni possono essere entità qualsiasi come, ad esempio, diversi soggetti o istanti temporali o luoghi), l'attenzione sarà rivolta al perfezionamento di tecniche di raggruppamento delle unità/occasioni/variabili applicabili al caso di elevata dimensionalità dei dati.
Inoltre, consapevoli che nell'investigazione dell'esclusione sociale si deve tenere conto di una molteplicità di elementi e di aspetti non univoci per cui è necessario prevedere criteri multipli e date le buone performance dei metodi meta euristici in problemi con elevata complessità, il progetto si propone di esplorare l'implementazione degli algoritmi genetici multi-obiettivo per il particolare problema di clustering.
L'innovatività del progetto può essere ravvisata nei seguenti punti:
- l'uso dei microdati dell'indagine "Reddito e condizioni di vita" (EU SILC - European Union Statistics on Income and Living Conditions) rilevati su ampi campioni rappresentativi a livello europeo e nazionale;
- il tentativo di delineare tipologie di esclusione sociale, in un'ottica multidimensionale, considerando congiuntamente un ampio spettro di dimensioni, andando oltre alle analisi basate solo su alcuni indici;
- la messa a punto e l'applicazione in ambito sociale di metodi meta euristici quali gli algoritmi genetici multi-obiettivo.
Nel presente progetto l'attenzione è rivolta essenzialmente al perfezionamento di tecniche di classificazione non supervisionata applicabili al caso in cui sia la numerosità dei casi (records o oggetti) che la dimensione dei dati (variabili) siano entrambe elevate. Dai microdati che si intende utilizzare verranno costruite le matrici di prossimità a due o tre vie sulle quali verrà condotta l'analisi esplorativa per l'individuazione di raggruppamenti e anomalie. In generale i grandi insiemi di dati organizzati in matrici di prossimità sono difficili da comprendere, per cui si rende necessario l'utilizzo di tecniche specifiche per estrarre informazioni rilevanti. In particolare sono necessarie tecniche in grado di esplorare il vasto spazio delle soluzioni ammissibili ottimizzando un qualche criterio interno o esterno: in questo ambito, sono stati condotti diversi tentativi al fine di sviluppare un metodo di clustering multi-obiettivo utilizzando la funzionalità di ricerca degli algoritmi genetici (oltre ai già citati Deb, 2001; Bandyopadhyay et al., 2007; Handl and Knowles, 2007; si può vedere anche Zitzler and Thiele, 1998; Zitzler et al., 2001).
Inoltre, rispetto al campo di applicazione prescelto, riveste un ruolo interessante l'esplorazione della fattibilità dal punto di vista computazionale e la validità di una tecnica basata su algoritmi genetici anche multi-obiettivo che affronti i problemi statistici e computazionali presentati nei problemi di raggruppamento. Un aspetto innovativo riguarda l'utilizzo degli algoritmi genetici multi-obiettivo con i quali sarà possibile tenere conto di diversi criteri nell'analisi dei dati volta all'investigazione dell¿esclusione sociale in modo da tenere in considerazioni le mutevoli sfaccettature di tale concetto così complesso da definire.
RIFERIMENTI BIBLIOGRAFICI RELATIVI ALL'INTERO PROGETTO
Bandyopadhyay, S., Maulik, U., Mukhopadhyay, A., 2007. Multiobjective genetic clustering for pixel classification in remote sensing imagery. IEEE Transactions on Geoscience and Remote Sensing, 45, 1506-1511
Coromaldi, M., Zoli, M., 2012. Deriving Multidimensional Poverty Indicators. Methodological Issues and an Empirical Analysis for Italy. Social Indicator Research, 107
Day, W.H.E., 1986. Foreword: Comparison and consensus of classifications. Journal of Classification, 3, 183 ¿ 185
Deb, K., 2001. Multi-objective Optimization Using Evolutionary Algorithms. John Wiley and Sons, Ltd, England
European Commission, 2010. The European Platform against Poverty and Social Exclusion: A European framework for social and territorial cohesion, Brussels, 16.12.2010, COM (2010) 758 final
Ferligoj, A., 1992. Direct multicriteria clustering algorithm. Journal of Classification, 9, 43 ¿ 61
Handl, J., Knowles, J., 2007. An Evolutionary Approach to Multiobjective Clustering. IEEE Transactions on Evolutionary Computation, 11, 56-76
Lu, Z., Peng, Y., Xiao, J., 2008. From comparing clusterings to combining clusterings, in: AAAI, 665¿ 670
Nolan, B., Whelan, C.T., 2010. Using Non-Monetary Deprivation Indicators to Analyze Poverty and Social Exclusion: Lessons from Europe? Journal of Policy Analysis and Management, 29 (2)
Zitzler, E., Thiele, L., 1998. An evolutionary algorithm for multiobjective optimization: The strength pareto approach. Tech. Rep. 43, Gloriastrasse 35, CH-8092 Zurich, Switzerland
Zitzler, E., Laumanns, M., Thiele, L., 2001. SPEA2: Improving the Strength Pareto Evolutionary Algorithm. Tech. Rep. 103, Gloriastrasse 35, CH-8092 Zurich, Switzerland