Una classificazione efficiente di eventi di segnale e di fondo è un ingrediente cruciale delle misure di precisione della fisica sperimentale delle particelle elementari. Negli esperimenti di fisica delle alte energie si rivelano i segnali lasciati dal passaggio delle particelle prodotte nella collisione attraverso tutti i sottorivelatori del sistema. L'analisi degli eventi viene effettuata basandosi sulle quantità cinematiche ricostruite, che vengono dette informazioni di alto livello.
Lo scopo di questo progetto è lo sviluppo di tecniche di intelligenza artificiale, da applicare alla misura della produzione di bosoni di Higgs che decadono in coppie di particelle elementari. Gli algoritmi di intelligenza artificiale (IA) e machine learning (ML) costituiscono infatti uno strumento innovativo che permette di apprendere dai dati stessi correlazioni e andamenti che gli algoritmi tradizionali non riescono a sfruttare. L'idea di questo progetto è quella di utilizzare i dati in modo più completo, partendo dalle mappe del passaggio delle particelle ricostruite tramite un tracciatore in campo magnetico e, in modo il più continuo possibile, correlandole alle mappe dei depositi energetici nei sistemi calorimetrici. Questa correlazione verrà implementata mediante reti neurali profonde, che prendono in input delle immagini bidimensionali rappresentanti la posizione del passaggio delle particelle, una per ogni strato del rivelatore, e che forniscono dunque una informazione di basso livello complementare a quella standard. Un algoritmo di questo tipo permetterà di incrementare la reiezione degli eventi che costituiscono il fondo del segnale, ovvero il decadimento del bosone di Higgs in due quark pesanti emessi vicini tra loro.
Nella fisica sperimentale delle alte energie il machine learning ha subito da pochi anni una rivitalizzazione, con un impiego crescente di tecniche di analisi multivariata e BDT. L'utilizzo di architetture innovative quali reti neurali profonde e convoluzionali per le ricerche di fisica sperimentale delle alte energie è ancora agli inizi ma, grazie ai risultati raggiunti al di fuori del campo accademico, diventerà un tema centrale dei prossimi anni.
L'incremento della potenza di calcolo a disposizione, necessaria per la fase di training delle reti neurali profonde, permetterà di sfruttare in un modo completamente nuovo i dati forniti dai grandi esperimenti del CERN, ATLAS e CMS. Partendo dall'informazione di basso livello proveniente dai rivelatori, sarà possibile infatti sfruttare la capacità di questi algoritmi di correlare i dati a disposizione per migliorare sia la selezione delle collisioni, in modo da ridurre il numero di eventi non interessanti che devono essere processati e salvati su disco, che l'analisi delle particelle in queste prodotte.
Per quanto riguarda la selezione degli eventi è infatti importante determinare se sono presenti o meno quegli adroni che decadono a distanze di qualche millimetro dal punto di collisione dei protoni, segnatura che indica la possibile produzione del bosone di Higgs. L'obiettivo è quindi sfruttare l'informazione di basso livello del rivelatore per incrementare del 15-20% l'efficienza di identificazione di queste speciali particelle e contemporaneamente aumentare l'efficienza di reiezione degli eventi legati alla produzione di particelle leggere che danno luogo a segnature simili a quella del bosone di Higgs. Discriminare meglio gli eventi permette di incrementare la sensibilità degli esperimenti al processo nella topologia boosted, che ad oggi non è ancora stato osservato.
L'applicazione di tecniche di ML per l'analisi delle immagini dei depositi energetici delle particelle nei rivelatori di fisica delle alte energie può essere davvero la chiave di volta per l'identificazione delle sottostrutture dei getti adronici, e potrà permettere la misura di precisione di quantità fisiche, predette dalla teoria delle interazioni fondamentali, che non sono ad oggi accessibili, come l'accoppiamento del bosone di Higgs ai quark beauty e charm.
La tipologia di algoritmi che sono interessato a sviluppare, basata sul riconoscimento e la correlazione di immagini ed informazioni di basso livello, sarà di fondamentale importanza nei collisori di prossima generazione. Questi saranno in grado di fornire collisioni tra pacchetti di particelle ad una frequenza comparabile a quella attuale, 40 MHz, ma con una luminosità più alta che si riflette nel numero di interazioni contemporanee, oltre 200, che si sovrappongono nel rivelatore. Un sistema efficiente di correlazione delle tracce ai depositi energetici nei calorimetri sarà dunque cruciale per consentire di sfruttare appieno i dati raccolti, permettendo di separare gli eventi con decadimenti del bosone di Higgs in quark pesanti da eventi di fondo accidentale.