L'argomento principale del presente progetto è lo studio di modelli statistici per serie storiche che presentano diverse discontinuità nel tempo. E' una questione di rilevanza attuale vista la crescente disponibilità di dati; nel caso delle serie storiche questo può implicare l'esistenza di diversi pattern e discontinuità nel corso dell'intervallo temporale di rilevazione. I tipi di discontinuità che andremo ad analizzare portano a modelli non stazionari, assumendo la possibilità di cambi strutturali nel tempo e l'esistenza di diversi regimi nel tempo. All'interno di ogni regime, quindi, i parametri del modello possono cambiare, sia rispetto alle caratteristiche del primo ordine (trend, medie) che a quelle del secondo (autocorrelazioni, varianze). In più andremo a considerare l'effetto stagionale, comune a dati in molti campi come la finanza, l'idrologia o la climatologia, analizzandolo mediante modelli periodici, possibilmente diversi in ogni regime. I modelli risultanti fanno uso di un insieme plausibilmente molto vasto di parametri, che può complicare l'interpretabilità dei risultati. Per questo motivo, una fase importante del progetto prevede studi di parsimonia per ridurre il numero dei parametri del modello. In particolare, verrà considerata la possibilità di raggruppare i parametri stagionali in gruppi (e.s. si passerà da mesi a trimestri), possibilmente anche di lunghezza non omogenea all'interno dell'anno. L'identificazione del modello risultante è un problema combinatoria intrattabile con metodi standard, quindi può essere approcciato con metodi di calcolo evolutivo come gli algoritmi genetici (GA). Il progetto si comporrà sia di fasi modellistiche che di implementazione computazionale, per poi utilizzare i metodi automatici prodotti per l'analisi di serie storiche reali in diversi ambiti applicativi.
Sono presenti in letteratura proposte in cui viene impiegata la modellistica PAR per descrivere serie stagionali soggette anche ad altre discontinuità nel tempo. Ad esempio, in Lu et al. (2010) vengono introdotti modelli PAR in cui viene considerata la possibilità di cambi di livello (mean shifts) nel corso del tempo. Anche in questo caso vengono utilizzati GA per l'identificazione del modello, usando il principio del Minimum Description Length nella funzione obiettivo. La nostra proposta prevederebbe cambi nell'intera struttura del modello, generalizzando quindi il metodo di Lu et al. (2010). E' stato affrontato, inoltre, anche il problema dell'accorpamento stagionale in modelli PAR. Thompstone et al. (1985) introduce i Parsimonious PAR models (PPAR), in cui parametri autoregressivi e medie di stagioni adiacenti possono essere accorpate sulla base di test d'ipotesi sulla varianza dei residui dei due periodi. Il nostro metodo, rispetto al paper di Thompstone et al. (1985), permetterebbe con procedure automatiche basate su criteri di identificazione di accorpare stagioni adiacenti in raggruppamenti di lunghezza arbitraria, in maniera diversa per le medie e per i parametri autoregressivi, e anche rispetto al regime nel tempo considerato.
In sintesi, il nostro metodo porterebbe a una generalizzazione di diverse procedure presenti in letteratura che considerano modelli PAR, cambi di struttura nel tempo e che propongono strategie di parsimonia.
Riferimenti:
Lu, Q., Lund, R., & Lee, T. C. (2010). An MDL approach to the climate segmentation problem. The Annals of Applied Statistics, 299-319.
R.M. Thompstone, K.W. Hipel, and I. Mcleod. (1985). Grouping of periodic autoregressive models. In O.D. Anderson, J.K. Ord, and E.A. Robinson (eds) Time series analysis: theory and practice 6. Proc. Conference Toronto 1983, pages 35-49. North-Holland, Amsterdam, 1985