Le meta-euristiche ispirate al comportamento di sistemi biologici presenti in natura sono adottate frequentemente nella risoluzione di problemi di ottimizzazione in diversi campi dell'ingegneria e non solo. Le strategie di computazione evolutiva sono infatti parte integrante di sistemi di Intelligenza Artificiale e Machine Learning, dove l'emergere del fenomeno "Big Data" pone nuove sfide in termini di gestione di risorse di memoria, dovute alla crescente numerosità dei dati da elaborare, come pure da un incremento della complessità dei singoli record nella base di dati a disposizione. Gli algoritmi evolutivi sequenziali in queste situazioni mostrano limitazioni importanti, sia dal punto di vista del tempo di esecuzione dell'intero processo di ottimizzazione, sia nella capacità di ricerca della soluzione ottima quando impiegati in una procedura di Big Data Mining. Un approccio ad evoluzione distribuita co-operativa, unitamente all'accelerazione in hardware delle operazioni a maggiore complessità computazionale, offre quindi l'opportunità di affrontare contemporaneamente le difficoltà che si riscontrano nel processo del Big Data Mining. Il progetto propone perciò lo sviluppo di un sistema di classificazione basato su un'innovativa strategia evolutiva distribuita che poggia le basi sulla co-operazione di entità atomiche dinamiche chiamate agenti, in grado di evolvere le proprie abilità di ricerca di regolarità nel problema di riferimento, sintetizzando progressivamente informazione di maggior qualità e accelerando in hardware dedicati come GPU e FPGA, le operazioni che definiscono il comportamento del singolo individuo del sistema multi-agente.
Il progetto propone l'utilizzo di tecniche derivanti da diverse discipline (Evolutionary computation, Artificial Intelligence, Granular Computing) per affrontare il tema del Big Data Mining mantenendo un alto livello di generalità riguardo l'applicazione specifica.
Lo schema progettuale proposto rende possibile realizzare un sistema di analisi Big Data con diverse caratteristiche che difficilmente sono presenti contemporaneamente nello stesso sistema.
Grazie alla sinergia del paradigma multi-agente unita ad una strategia di decomposizione del problema e insieme all'uso di modelli di apprendimento non-supervisionato, è possibile innescare un meccanismo di local metric learning [1]. Ogni agente è caratterizzato da una specifica istanza di una misura di dissimilarità e un algoritmo di clustering può selezionare le caratteristiche fondamentali dei pattern di ingresso che permettono di identificare delle regolarità all'interno del problema assegnato al singolo agente. La possibilità di operare questo tipo ricerca è di fondamentale importanza sia in problemi il cui spazio di ingresso sia prettamente geometrico, sia nel caso la struttura dati sia ben più complicata: degno di nota è il caso dei problemi definiti nello spazio dei grafi in cui la misura di dissimilarità adottata è spesso definita come costo della minima sequenza di operazioni elementari su due grafi (inserzione,cancellazione, sostituzione) per ottenere un isomorfismo [2], in cui il peso di tali operazioni deve essere opportunamente stabilito e riconduncibile ad un problema di local metric learning [3].
In accordo con l'approccio granulare [4] insito nel comportamento del singolo agente è possibile identificare un ulteriore aspetto innovativo del sistema. Trattando problemi relativi a sistemi complessi è possibile pensare infatti che ogni agenti operi su un insieme di sotto-strutture che compongono il sistema nella sua interezza, in accordo con il metodo di scomposizione ampiamente trattato precedentemente. Così facendo, i granuli di informazioni opportunamente estratti, oltre ed assere rilevanti per un processo di classificazione sulla base di un modello di apprendimento supervisionato, risulterebbero interpretabili ed analizzabili da esperti del settore del problema di riferimento.
E' importante inoltre rimarcare come lo specifico design del sistema non vincoli assolutamente il processo di granulazione ad uno specifica strategia come ad esempio quella di clustering, ma permetta di estendere agevolmente il sistema ad altre strategie di granularizzazione con il vincolo di definire opportunamente una regola di associazione pattern-granulo[5].
Il sistema si presta ad applicazioni in svariati settori i cui problemi possono assumere caratteristiche ben diverse tra loro. Con lo schema proposto si può immaginare di mettere a punto un meccanismo di fault detection in sistemi di distribuzione energetica [6] allo scopo di minimizzare quindi i costi di ispezione e riparazione della rete sottostante fornendo indicazioni sulle condizioni di utilizzo dei componenti coinvolti, aspetto di fondamentale importanza in vista dell'intervento umano.
Un'altra possibile applicazione di particolare interesse può riguardare il campo del riconoscimento di attacchi informatici. Analizzando in tempo reale le sequenze di pacchetti e scomponendoli in sottostrutture, sarebbe possibile stabilire dei pattern (intesi come possibili schemi regolari) di attacco di alcune tecniche di intrusione e/o interruzione di servizi informatici [7].
[1] BELLET, Aurélien; HABRARD, Amaury; SEBBAN, Marc. Metric learning. Synthesis Lectures on Artificial Intelligence and Machine Learning, 2015, 9.1: 1-151.
[2] FOGGIA, Pasquale; PERCANNELLA, Gennaro; VENTO, Mario. Graph matching and learning in pattern recognition in the last 10 years. International Journal of Pattern Recognition and Artificial Intelligence, 2014, 28.01: 1450001.
[3] NEUHAUS, Michel; BUNKE, Horst. Automatic learning of cost functions for graph edit distance. Information Sciences, 2007, 177.1: 239-247.
[4] BARGIELA, Andrzej; PEDRYCZ, Witold. Granular computing. In: HANDBOOK ON COMPUTATIONAL INTELLIGENCE: Volume 1: Fuzzy Logic, Systems, Artificial Neural Networks, and Learning Systems. 2016. p. 43-66.
[5] LIN, Tsau Young; YAO, Yiyu Y.; ZADEH, Lotfi A. (ed.). Data mining, rough sets and granular computing. Physica, 2013.
[6] DE SANTIS, Enrico, et al. Modeling and recognition of smart grid faults by a combined approach of dissimilarity learning and one-class classification. Neurocomputing, 2015, 170: 368-383.
[7] RIZZI, Antonello; GRANATO, Giuseppe; BAIOCCHI, Andrea. Frame-by-frame Wi-Fi attack detection algorithm with scalable and modular machine-learning design. Applied Soft Computing, 2020, 106188.