Analyse et prédiction de séries temporelles par méthodes non linéaires Application à des données industrielles et financières
L'analyse et la prédiction de séries temporelles sont des défis scientifiques importants, qui trouvent leurs applications dans des domaines aussi variés que la finance, la production électrique, l’hydrologie, la climatologie, etc. Comme ils englobent les modèles linéaires, les modèles non linéaires offrent potentiellement des performances supérieures mais ils posent cependant également des problèmes complexes tels que des minima locaux pour la fonction à optimiser, des temps de calcul très longs, une sélection de structure de modèle rendue plus difficile et une détermination de régresseur plus ardue. On définit tout d’abord la meilleure structure de modèle comme celle qui minimise une erreur de généralisation. Les différentes méthodes permettant d’estimer cette erreur sont présentées : Cross-Validation, Leave-One-Out, Bootstrap, etc. Une comparaison expérimentale de ces méthodes sur une série benchmark classique montre la supériorité des méthodes de Bootstrap. Une accélération de ces méthodes ainsi qu’une solution au problème des minima locaux sont apportées. Les différentes méthodes de détermination du meilleur régresseur, c’est-à-dire le vecteur d’entrées utilisé pour la prédiction, sont étudiées. Afin de donner une borne inférieure et une borne supérieure à la taille de ce régresseur, plusieurs interprétations du théorème de Takens sont formulées. Une méthodologie pratique permettant la construction d’un régresseur par projection non linéaire est proposée et illustrée sur des exemples de prédiction de séries financières. Des modèles non linéaires simples basés sur la quantification vectorielle sont développés. Ils proposent une alternative dont les performances et la complexité se situent entre celles des modèles linéaires et des modèles non linéaires classiques : les performances sont meilleures que celles obtenues avec des modèles linéaires mais les temps de calcul demandés sont moins importants que pour les autres modèles non linéaires. Finalement, une méthode d’analyse de données basée sur les cartes auto-organisées et l’algorithme de Ward est présentée. Cette méthode d’analyse débouche sur une méthode de prédiction à long terme dont les résultats sont évalués sur la prédiction, sur une durée de 24h, de la consommation électrique