Artificial neural network forecasting of nonlinear Markov processes

    loading  Checking for direct PDF access through Ovid

Abstract

I assessed the performance characteristics of the feed-forward artificial neural network (ANN) as a first-order nonlinear Markov modelling technique. The ability to recover the underlying structure of five synthetic random time series was first tested. The method was then applied to an observed geophysical time series, and the results were compared against external empirical constraints and a simple representation of the underlying physics. The Monte Carlo experiments suggested that the ANN–Markov technique: (i) yields good prediction skill; (ii) in general, accurately retrieves the form of the iterative mapping, even for extremely noisy data; (iii) accomplishes the foregoing without any need to consider or adjust for the distributional characteristics of the data or driving noise; and (iv) accurately estimates the distribution of the strictly stochastic signal component. Application to a historical river-flow record again showed good forecast skill. Moreover, the robustness, flexibility, and simplicity of the method permitted easy identification of the fundamental nonlinear physical dynamics of this environmental system directly from the time series data, perhaps belying the common perception of ANNs as a strictly black-box prediction technique. The ANN–Markov technique may thus serve as a valuable data-driven tool for guiding the development of both process-based and parameteric statistical models. The lack of specific distributional assumptions and requirements notwithstanding, it was also found that manual distributional transformations may permit the method to be tuned to particular applications by emphasizing or de-emphasizing certain features of the data. Drawbacks to the method include substantial data-set length requirements, a general limitation of ANNs, as well as an inconsistent but potentially troubling tendency to partially imprint the form of the ANN activation function upon the estimated recursion relationship.PACS Nos.: 02.50.Ga, 05.10.–a, 05.45.Tp, 07.05.Mh, 02.50.Ey, 92.40.Fb

J'analyse les performances d'un réseau de neurones à réaction positive (ANN) en tant que technique de Markov non-linéaire du premier ordre. Nous avons testé d'abord la capacité à recouvrer la structure sous-jacente d'une série de cinq temps synthétiques au hasard. La méthode a alors été appliquée à une série de temps géophysiques et les résultats comparés à des contraintes empiriques extérieures et à une représentation simple de la physique impliquée. Les expériences Monte Carlo suggèrent que la technique ANN–Markov (i) a de bonnes capacités prédictives, (textit{ii}) en général, retrouve de façon précise les applications itératives, même pour des données montrant beaucoup de bruit de fond, (textit{iii}) accomplit ces opérations sans nécessiter d'ajustement des caractéristiques de distribution des données ni du bruit et (textit{iv}) prédit de façon précise la distribution de la composante purement stochastique du signal. Son utilisation avec les données historiques du flux d'une rivière montre là aussi une bonne capacité prédictive. De plus, la robustesse, la flexibilité et la simplicité de la méthode permettent d'identifier facilement la dynamique de la physique non-linéaire du système environnemental directement à partir de la série temporelle, faisant mentir la croyance populaire que la technique ANN est une pure boîte noire. La technique ANN–Markov peut donc être utilisée comme outil valable, contrôlé par les données, pour développer des modèles, soit basés sur les procédés, soit à paramètres statistiques. En dépit de l'absence d'hypothèse ou d'exigence sur les caractéristiques de la distribution, nous avons découvert que certaines transformations faites manuellement sur les distributions permettent de focaliser sur certaines applications en modifiant l'importance de caractéristiques particulières des données. Les inconvénients de la méthode incluent le besoin de référer à des ensembles importants de données, une certaine limite de ANN et une certaine tendance potentiellement troublante de surimposer la forme de la fonction d'activation ANN sur la relation de récursion.[Traduit par la Rédaction]

Related Topics

    loading  Loading Related Articles