Nome e qualifica del proponente del progetto: 
sb_p_2517810
Anno: 
2021
Abstract: 

Uno dei temi di ricerca più importanti, nato inizialmente per i settori ¿Mission Critical¿ quali spazio e difesa, è la protezione di un circuito da eventuali fault prodotti da agenti esterni ed ambientali. Negli ultimi decenni, grazie al forte progresso tecnologico, tale tema è stato associato anche a diversi settori consumer detti ¿Safety Critical¿ quali industria ed automotive, portando alla nascita ed all¿ampliamento di diversi metodi ed approcci di protezione hardware/software, dove concetti di affidabilità ed alte performance giocano un ruolo chiave non solo per il settore della ricerca, ma anche per aspetti pratici ed implementativi.
La proposta di ricerca di seguito presentata, si basa sullo studio di tecniche e modelli di analisi per Fault Resilience all¿interno di architetture digitali a microprocessore, con annesso studio ed implementazione di modelli per supporto hardware e software alla fault detection e fault resilience, come ad esempio l¿ottimizzazione hardware di strutture digitali inizialmente non ridondate agli errori. Il target principale è volto alla robustezza del circuito e la sua capacità di rilevare e correggere eventuali errori mantenendo alte le performance, testando iterativamente la robustezza hardware ottenuta dalle tecniche implementate attraverso strumenti software e hardware di fault injection, in grado di provocare errori nel sistema al fine di valutarne il corretto funzionamento. Di forte interesse dal punto di vista hardware, è la capacità di poter inserire errori fisici in determinati dispositivi target quali ASIC o più generalmente dispositivi COTS (Commercial Off the Shelf) quali microcontrollori o FPGA.

ERC: 
PE7_3
PE6_2
PE6_1
Componenti gruppo di ricerca: 
sb_cp_is_3445160
Innovatività: 

L¿interesse tecnologico in aspetti relativi alla safety di sistemi digitali nasce in concomitanza con lo sviluppo dell¿era spaziale. Inizialmente, le diverse tecniche sviluppate, hanno avuto specifiche applicazioni in un mercato ristretto e di nicchia, legato soltanto ad ambienti spaziali ed ambienti militari, con importanti costi in termini di produzione e mercato. Negli ultimi decenni, grazie al progresso tecnologico in ambito embedded, e al continuo sviluppo elettronico in diversi ambiti industriali, tali tecniche hanno acquisito un forte interesse pratico ed implementativo, portando all¿estensione dei range applicativi non più soltanto al mondo spaziale e militare, bensì anche al mondo automotive, industriale e consumer. L¿interesse per i processi di safety è stato ampliato quindi anche su un mercato commerciale, in grado di abbattere i costi di sviluppo e produzione; ed è proprio a tal fine che sono di particolare attenzione tutte quelle tecniche innovative che permettono di fronteggiare i rischi dovuti alla maggior vulnerabilità dei sistemi elettronici causata dall¿aumento di complessità dei sistemi stessi e dal continuo scaling tecnologico. Di esempio pratico, sono applicazioni quali microcontrollori per la Functional-Safety in ambito automotive, o applicazioni di controllo all¿interno di produzioni industriali particolarmente sensibili in termini di criticità quali ambiti avionici, biomedici o ambiti nucleari. L¿interesse pratico per lo sviluppo di nuove tecniche per la fault tolerance è relativo anche agli ambienti per le quali le stesse sono nate, come il mondo dell¿industria spaziale. Non è da sottovalutare infatti, che con il continuo progresso in ambito delle telecomunicazioni, il mercato satellitare e nano-satellitare abbia avuto un forte sviluppo negli ultimi anni, portando ad una conseguente rivisitazione dei processi produttivi e conseguente diminuzione dei costi ad essi associati, con interesse per tecnologie COTS (Commercial Of the Shelf), in grado di implementare metodologie safety su dispositivi a basso costo quali microcontrollori sviluppati con processi e tecnologie commerciali o FPGA.
Il progetto di ricerca proposto viene inquadrato all¿interno del panorama tecnologico e commerciale sopra citato, perché permette di seguirne e testarne il continuo sviluppo. Proporre un feedback loop tra progettazione delle architetture ridondate e relativo supporto hardware / software, con l¿analisi di Fault Injection, copre tutti gli aspetti che portano alla creazione di dispositivi testati e validati per specifiche applicazioni. L¿attenzione per questa metodologia permette di analizzare e migliorare gli ambiti di interesse dal punto di vista dello stato dell¿arte, come ad esempio vantaggi e prestazioni in termini di throughput, overhead, tempi di esecuzione e ripristino di eventuali condizioni di fault, con annessa valutazione dei trade off tra resilienza e velocità, tra costo hardware e costo energetico, tra costo hardware e velocità di recupero in caso di fault.
Verrà evidenziato l¿aspetto hardware di queste tecniche relativamente alla loro funzionalità in termini di trade-off tra resilienza prodotta e impatto sulla velocità di clock, e verranno implementate le tecniche studiate sfruttando i dati ottenuti dalle analisi di Fault Injection, le quali verranno effettuate su diversi fronti tecnologici di analisi sia software che hardware. La proposta di un ampio range di verifica, relativamente ad aspetti di questo tipo, permette di avere maggior coverage sulla validazione del prodotto finale, vantaggio che non sempre è rispettato dai sistemi tutt¿oggi presenti in letteratura, che guardano spesso soltanto all¿implementazione di eventuali tecniche di protezione, tralasciando gli aspetti di verifica e validazione delle stesse. L¿aspetto realizzativo in termini di tecniche Fault Tolerance è relativo all¿analisi dell¿architettura Klessydra-T13, processore IMT (Interleaved Multi Thread) sviluppato dal laboratorio di sistemi digitali VLSI dell¿università ¿La Sapienza¿. Tale aspetto, rientra nel sistema di utilizzo di processori multithread per applicazioni di ridondanza e tolleranza ai guasti, ma contrariamente a quanto appare nella letteratura citata, non fa parte di processori SMT (Simultaneous Multi Threading), e rappresenta un campo di studio non ancora a fondo verificato e analizzato, a causa di diverse difficoltà in termini di condivisione delle risorse hardware, ma con forti potenzialità su sviluppo ed applicazioni.

Codice Bando: 
2517810

© Università degli Studi di Roma "La Sapienza" - Piazzale Aldo Moro 5, 00185 Roma