L'Ottimizzazione si occupa dello studio e della progettazione di algoritmi in grado di determinare massimi o minimi di funzioni che rappresentino l'obiettivo di modelli matematici. Il Machine Learning, o apprendimento automatico, consiste nell'individuazione e nella messa a punto di tecniche per apprendere dai dati informazioni tali da effettuare automaticamente predizioni su nuovi dati. Nello studio di molti problemi pratici questi due aspetti sono entrambe necessari, si complementano a vicenda, e possono anche sfumare l'uno nell'altro a seconda che il punto di vista sia più imperniato su modelli matematici o direttamente basato sui dati. Inoltre, molte tecniche di Machine Learning richiedono nel corso dei loro passi la risoluzione di problemi di ottimo, mentre alcuni algoritmi di ottimizzazione possono beneficiare di informazioni scoperte tramite tecniche di apprendimento automatico.
Lo scopo della ricerca proposta è di affrontare mediante gli strumenti descritti sopra una serie di problemi di decisione molto importanti dal punto di vista applicativo. Tali problemi possono emergere in contesti anche notevolmente diversi tra loro ma risultano accomunati dal fatto di essere computazionalmente onerosi e dalla necessità di estrarre le informazioni di interesse da grandi quantità di dati. Si tratta di problemi con grande importanza applicativa che vengono tipicamente associati al livello di pianificazione strategico. Verranno in particolare affrontati: Problemi di Selezione di Investimenti, Problemi di Classificazione di Testi o di Dati Biomedici, Problemi di Ricostruzione Ottima di Informazione Corrotta, Problemi di Determinazione di Parametri in leggi di Controllo. Il lavoro pertanto prevede lo svolgimento di differenti attività, di carattere anche interdisciplinare, ma concettualmente accomunate.
La ricerca proposta ha un elevato potenziale di innovatività ed originalità. Come prima cosa, lo sfruttamento congiunto di tecniche avanzate di ottimizzazione e machine learning può produrre notevoli miglioramenti algoritmici, permettendo di risolvere con successo problemi pratici estremamente importanti ma attualmente molto difficili o impossibili da risolvere. Inoltre, un tale studio può generare ricadute positive a vari livelli, non ultima una cross-fertilizzazione tra i due campi.
Più in dettaglio, molti algoritmi di Machine Learning richiedono, nel corso delle loro operazioni, dei passaggi che in realtà costituiscono problemi di Ottimizzazione, i quali risultano quindi contenuti come sottoproblemi. Ignorare questo aspetto non rende affatto le attività più semplici, ma al contrario porta al fallimento dei passaggi difficili, e quindi a soluzioni complessive di minore qualità, senza peraltro che le motivazioni di ciò siano note. Al contrario, l'identificazione dei sottoproblemi difficili di ottimizzazione all'interno delle suddette attività può portare ad ottenere risultati migliori.
Specularmente, nella soluzione di molti problemi di ottimizzazione, sono richieste informazioni che devono essere spesso definite a priori. Esempi classici sono: stime di costi, quantificazione di preferenze, determinazione di associazioni, scelte di punti iniziali, etc. Anziché essere costretti a "indovinare", tali informazioni possono in realtà essere stimate al meglio usando i dati del problema mediante tecniche di Machine Learning; così facendo si beneficia inoltre dei vantaggi di un approccio data-driven.
Questa visione più completa permette quindi nel complesso lo sviluppo di approcci metodologicamente più robusti ed equilibrati nella risoluzione dei problemi affrontati. Rende inoltre possibile giovarsi dell'approccio modellistico per ogni singolo sottoproblema, ovverosia, una volta individuato il modello relativo al singolo sottoproblema, viene scelto e applicato un algoritmo adatto alla risoluzione di quel tipo di modello ottenuto, prescindendo dal problema originale. Come noto, questo approccio è molto conveniente in quanto permette di sfruttare i risultati già disponibili in letteratura per modelli aventi analoga struttura anche se originati in contesti completamente diversi. Occorre naturalmente sottolineare che, per ottenere in questo modo avanzamenti rispetto allo stato dell'arte, è necessaria una costante attività di studio e ricerca.
Si noti anche che gli approcci proposti per la risoluzione dei problemi considerati sono esclusivamente formali, non dipendendo affatto dagli specifici aspetti semantici dei dati in oggetto. Ciò permette di estendere questi approcci a problemi aventi le stesse caratteristiche formali anche se relativi ad ambiti diversi e quindi descritti da dati aventi diverso significato. A mero titolo di esempio, i problemi di selezione di portafoglio sono estremamente diffusi in vari ambiti, partendo dai più ovvi casi di gestione di fondi di investimento fino agli aspetti di scelta di portafogli energetici o di mix produttivi, che hanno le stesse caratteristiche formali dei precedenti ma significato completamente diverso.
Una buona parte del progetto proposto risulta quindi costituito da nuove linee di ricerca, mentre la restante parte rappresenta invece il proseguimento del Progetto di Ricerca di Ateneo 2016 " Tecniche di Ottimizzazione Combinatoria per la risoluzione di problemi di Data Mining in campo Economico-Gestionale", concluso ad inizio 2020.