Wednesday, 10 October 2018

Moving average box jenkins


O modelo ARMA Box-Jenkins é uma combinação dos modelos AR e MA (descritos na página anterior): começo Xt delta phi1 X phi2 X cdots phip X At - theta1 A - theta2 A - cdots - thetaq A. Onde os termos na equação têm o mesmo significado dado para o modelo AR e MA. Comentários sobre o Box-Jenkins Modelo Um par de notas sobre este modelo. O modelo Box-Jenkins assume que a série de tempo é estacionária. Box e Jenkins recomendam a série não-estacionária diferenciada uma ou mais vezes para conseguir a estacionaridade. Fazendo isso produz um modelo ARIMA, com o I para Integrado. Algumas formulações transformam a série subtraindo a média da série de cada ponto de dados. Isto produz uma série com uma média de zero. Se você precisa fazer isso ou não é dependente do software que você usa para estimar o modelo. Box-Jenkins modelos podem ser estendidos para incluir sazonal autoregressive e sazonal médio móvel termos. Embora isso complique a notação e a matemática do modelo, os conceitos subjacentes aos termos sazonais de média móvel autorregressiva e sazonal são semelhantes aos termos não-sazonais autorregressivos e de média móvel. O modelo mais geral de Box-Jenkins inclui operadores de diferença, termos autorregressivos, Termos médios, operadores de diferença sazonal, termos sazonais autorregressivos e termos de média móvel sazonal. Como no caso da modelagem em geral, no entanto, apenas os termos necessários devem ser incluídos no modelo. Os interessados ​​nos detalhes matemáticos podem consultar Box, Jenkins e Reisel (1994). Chatfield (1996). Ou Brockwell e Davis (2002). Etapas na modelagem Box-Jenkins Devem ser observadas as observações a seguir relativas aos modelos Box-Jenkins. Box-Jenkins modelos são bastante flexíveis devido à inclusão de ambos autorregressive e média móvel termos. Com base na decomposição de Wold ali (não discutida no Manual), um processo estacionário pode ser aproximado por um modelo ARMA. Na prática, achar que a aproximação pode não ser fácil. Chatfield (1996) recomenda métodos de decomposição para séries em que a tendência e os componentes sazonais são dominantes. Building bons modelos ARIMA geralmente requer mais experiência do que comumente utilizados métodos estatísticos, como a regressão. Série Suficientemente Longo Necessário Normalmente, o encaixe eficaz dos modelos Box-Jenkins requer pelo menos uma série moderadamente longa. Chatfield (1996) recomenda pelo menos 50 observações. Muitos outros recomendariam pelo menos 100 observações. O primeiro passo no desenvolvimento de um modelo Box-Jenkins é determinar se a série é estacionária e se há qualquer sazonalidade significativa que precisa ser modelada. A estacionariedade pode ser avaliada a partir de um diagrama de sequência de execução. O gráfico de sequência de execução deve mostrar localização e escala constantes. Também pode ser detectado a partir de um gráfico de autocorrelação. Especificamente, a não estacionariedade é muitas vezes indicada por um gráfico de autocorrelação com decaimento muito lento. Diferenciação para alcançar a estacionaridade Box e Jenkins recomendam a abordagem de diferenciação para conseguir a estacionaridade. No entanto, o ajuste de uma curva e a subtração dos valores ajustados dos dados originais também podem ser usados ​​no contexto dos modelos Box-Jenkins. Na etapa de identificação do modelo, nosso objetivo é detectar a sazonalidade, se existir, e identificar a ordem dos termos sazonais autorregressivos e sazonais de média móvel. Para muitas séries, o período é conhecido e um único termo de sazonalidade é suficiente. Por exemplo, para dados mensais tipicamente incluiríamos um termo AR 12 temporário ou um termo MA 12 sazonal. Para os modelos Box-Jenkins, não removemos a sazonalidade explicitamente antes de montar o modelo. Em vez disso, incluímos a ordem dos termos sazonais na especificação do modelo para o software de estimativa ARIMA. No entanto, pode ser útil aplicar uma diferença sazonal aos dados e regenerar as parcelas de autocorrelação e de autocorrelação parcial. Isso pode ajudar na identificação do modelo da componente não sazonal do modelo. Em alguns casos, a diferenciação sazonal pode remover a maior parte ou todo o efeito da sazonalidade. Identificar p e q Uma vez que a estacionariedade ea sazonalidade foram abordadas, o próximo passo é identificar a ordem (isto é, o (p) e (q)) dos termos autorregressivos e de média móvel. Autocorrelação e parcelas de autocorrelação parcial As ferramentas primárias para fazer isso são o gráfico de autocorrelação eo gráfico de autocorrelação parcial. O gráfico de autocorrelação da amostra eo gráfico de autocorrelação parcial da amostra são comparados com o comportamento teórico destas parcelas quando a ordem é conhecida. Ordem do Processo Autoregressivo ((p)) Especificamente, para um processo AR (1), a função de autocorrelação da amostra deve ter uma aparência decrescente exponencialmente. Contudo, os processos de AR de ordem superior são frequentemente uma mistura de componentes sinusoidais exponencialmente decrescentes e amortecidos. Para processos autoregressivos de ordem superior, a autocorrelação da amostra precisa ser suplementada com um gráfico de autocorrelação parcial. A autocorrelação parcial de um processo AR ((p)) torna-se zero em lag (p 1) e maior, então examinamos a função de autocorrelação parcial da amostra para ver se existe evidência de uma partida de zero. Isso geralmente é determinado colocando um intervalo de confiança de 95 no gráfico de autocorrelação parcial da amostra (a maioria dos programas de software que geram gráficos de autocorrelação da amostra também traçará este intervalo de confiança). Se o programa de software não gera a banda de confiança, é aproximadamente (pm 2 / sqrt), com (N) indicando o tamanho da amostra. Ordem do Processo de Média Móvel ((q)) A função de autocorrelação de um processo MA ((q)) torna-se zero em atraso (q 1) e maior, então examinamos a função de autocorrelação da amostra para ver onde ela se torna essencialmente zero. Fazemos isso colocando o intervalo de confiança de 95 para a função de autocorrelação da amostra no gráfico de autocorrelação da amostra. A maioria dos softwares que podem gerar o gráfico de autocorrelação também pode gerar esse intervalo de confiança. A função de autocorrelação parcial de amostra geralmente não é útil para identificar a ordem do processo de média móvel. Forma da Função de Autocorrelação A tabela a seguir resume como usamos a função de autocorrelação da amostra para a identificação do modelo. Previsão 101: O Box-Jenkins Forecasting Box-Jenkins (ARIMA) é um método de previsão importante que pode gerar previsões altamente precisas para certos tipos de dados. Nesta seção de Previsão 101 bem analisar os prós e contras da Box-Jenkins modelagem, fornecer uma visão conceitual de como a técnica funciona e discutir a melhor forma de aplicá-lo aos dados de negócios. Um pouco de História Em 1970, George Box e Gwilym Jenkins popularizaram os modelos ARIMA (Autoregressive Integrated Moving Average) em seu livro seminal, Time Series Analysis: Forecasting and Control 1. Tecnicamente, a técnica de previsão descrita no texto é um modelo ARIMA, Os meteorologistas (incluindo o autor) usam as frases modelos ARIMA e modelos Box-Jenkins intercambiáveis. Os modelos ARIMA geraram inicialmente muita excitação na comunidade acadêmica, devido principalmente a seus pressupostos teóricos, que provaram que, se determinadas premissas fossem cumpridas, os modelos renderiam previsões ótimas. No início, a técnica não gozava de uso generalizado entre a comunidade empresarial. Isto foi principalmente devido ao procedimento difícil, demorado e altamente subjetivo descrito por Box e Jenkins para identificar a forma adequada do modelo para um dado conjunto de dados. Para piorar as coisas, estudos empíricos mostraram que, apesar da superioridade teórica dos modelos ARIMA em relação a outros métodos de previsão, na prática os modelos não superam os outros métodos de séries crônicas rotineiramente. Um estudo empírico particularmente importante descobriu que os modelos de suavização exponencial superaram Box-Jenkins 55 do tempo em uma amostra de 1.001 conjuntos de dados 2. Isso ainda é uma boa exibição para Box-Jenkins (ele superou a suavização exponencial 45 do tempo), então o Lição aqui, é que, idealmente, seria possível alternar entre diferentes abordagens, conforme apropriado, em vez de tomar uma abordagem de tamanho único. O desafio para um previsor corporativo é determinar que conjuntos de dados são mais adequados para Box-Jenkins e, em seguida, para identificar a forma adequada do modelo. A captura de tela acima mostra a previsão gerada a partir de um modelo ARIMA juntamente com a lógica de seleção de especialistas e os detalhes do modelo. Hoje, pacotes de software como o Forecast Pro usam algoritmos automáticos para decidir quando usar os modelos Box-Jenkins e para identificar automaticamente a forma adequada do modelo. Essas abordagens automáticas têm mostrado que superam os procedimentos de identificação manual e tornaram os modelos Box-Jenkins acessíveis e úteis para a comunidade de previsão de negócios. 3. Embora existam formas multivariadas de modelos ARIMA, a maioria do uso do método é uma técnica de previsão de séries temporais . (Os métodos de séries temporais são técnicas de previsão que baseiam a previsão apenas no histórico do item que você está previendo.) Como uma técnica de séries temporais, os modelos ARIMA são apropriados quando você pode assumir uma quantidade razoável de continuidade entre o passado e o futuro. Os modelos são mais adequados para previsão de curto prazo 8212say 18 meses ou less8212due a sua suposição de que os padrões e tendências futuras se assemelham padrões atuais e tendências. Esta é uma suposição razoável no curto prazo, mas torna-se mais tênue quanto mais fora você previsão. Box-Jenkins modelos são semelhantes aos modelos de suavização exponencial em que eles são adaptáveis, podem modelar tendências e padrões sazonais, e pode ser automatizado. Eles diferem em que eles são baseados em autocorrelações (padrões no tempo) ao invés de uma visão estrutural de nível, tendência e sazonalidade. Box-Jenkins tende a ter sucesso melhor do que suavização exponencial para conjuntos de dados mais longos e estáveis ​​e não tão bem para dados mais ruidosos e mais voláteis. Os modelos Box-Jenkins são matematicamente complexos. Neste artigo, iremos fornecer uma visão conceitual muito básica de como um modelo ARIMA funciona e introduzir alguma notação associada ao modelo. Se você estiver interessado em aprender mais sobre os modelos Box-Jenkins, eles são abordados em detalhes no Forecast Pro Statistical Reference Manual e em praticamente todos os livros acadêmicos sobre a previsão de séries temporais. Um modelo ARIMA tem 3 componentes, cada um dos quais ajuda a modelar diferentes tipos de padrões. O AR significa auto-regressivo. O I representa integrado. O MA significa média móvel. Cada componente tem uma ordem de modelo associada que indica o tamanho do componente. Geralmente, um modelo não-sazonal de Box-Jenkins é simbolizado como ARIMA (p, d, q) onde p indica o número de termos AR, d indica a ordem de diferenciação e q indica o número de termos MA. Um modelo de Box-Jenkins sazonal é simbolizado como ARIMA (p, d, q) (P, D, Q), onde p, d, q indica as ordens do modelo para os componentes de curto prazo do modelo e P, D, Q indica as ordens do modelo para os componentes sazonais do modelo. Identificar os modelos adequados de Box-Jenkins requer determinar as ordens do modelo. Teoricamente, as ordens do modelo podem assumir valores inteiros na prática, geralmente são 0, 1, 2 ou 3. Isso ainda produz centenas de modelos diferentes para considerar uma das razões pelas quais a identificação manual dos modelos é tão difícil. Box-Jenkins é um método de previsão importante que pode gerar previsões mais precisas do que outros métodos de séries temporais para certos tipos de dados. Como originalmente formulado, a identificação do modelo se baseava em um procedimento difícil, demorado e altamente subjetivo. Hoje, pacotes de software como o Forecast Pro usam algoritmos automáticos para decidir quando usar os modelos Box-Jenkins e para identificar automaticamente a forma adequada do modelo. Essas abordagens automáticas tornaram os modelos Box-Jenkins acessíveis e úteis para a comunidade de previsão de previsão de negócios. 1 G. E. P. Box e G. M. Jenkins 1976 Análise de séries temporais: Previsão e Controle. Revised Edition, São Francisco: Holden Day. 2 S. Makridakis et ai. 1984 A precisão de previsão dos métodos principais da série de tempo. Chichister: Wiley. 3 Um estudo de Spyros Makridakis e um do Statistician americano mostraram ambos o Forecast Pros automático Box-Jenkins procedimento para superar a identificação manual por peritos humanos. Referem-se à referência anterior de Makridakis e a: Keith Ord e Sam Lowe 1996 Automatic Forecasting, The American Statistician. Sobre o autor: Eric Stellwagen é o co-fundador da Business Forecast Systems, Inc e co-autor da linha de produtos de software Forecast Pro. Ele tem consultado amplamente na área de previsão de negócios práticos e gasta 20-30 dias por ano apresentando oficinas sobre o assunto. Ele trabalhou com muitas empresas líderes, incluindo Coca-Cola, Procter Gamble, Merck, Blue Cross Blue Shield, Nabisco, Owens-Corning e Verizon. Ele apresentou seminários e workshops sob a égide de muitos grupos, incluindo o Instituto de Educação Profissional, a Sociedade Americana de Controle de Produção e Inventário, a Universidade de Wisconsin, o Instituto de Previsão de Negócios, o Grupo Mundial de Pesquisa, o Instituto Internacional de Pesquisa, Instituto de Pesquisa de Energia Elétrica, a International Communications Forecasting Association eo Instituto Internacional de Previsões. Atualmente, ele é membro do conselho de diretores do Instituto Internacional de Previsões e do conselho consultivo de consultoria da Foresight: The International Journal of Applied Forecasting. A RIMA significa Autoregressive Integrated Moving Average. Univariada (vetor único) ARIMA é uma técnica de previsão que projeta os valores futuros de uma série baseada inteiramente em sua própria inércia. Sua principal aplicação é na área de previsão de curto prazo, exigindo pelo menos 40 pontos de dados históricos. Ele funciona melhor quando seus dados exibem um padrão estável ou consistente ao longo do tempo com uma quantidade mínima de outliers. Às vezes chamado Box-Jenkins (após os autores originais), ARIMA é geralmente superior às técnicas de suavização exponencial quando os dados são razoavelmente longos ea correlação entre as observações passadas é estável. Se os dados forem curtos ou altamente voláteis, então algum método de alisamento pode funcionar melhor. Se você não tiver pelo menos 38 pontos de dados, você deve considerar algum outro método que ARIMA. O primeiro passo na aplicação da metodologia ARIMA é verificar a estacionaridade. A estacionariedade implica que a série permanece a um nível razoavelmente constante ao longo do tempo. Se existe uma tendência, como na maioria das aplicações econômicas ou de negócios, os dados NÃO são estacionários. Os dados também devem mostrar uma variação constante em suas flutuações ao longo do tempo. Isto é facilmente visto com uma série que é fortemente sazonal e crescendo a um ritmo mais rápido. Nesse caso, os altos e baixos da sazonalidade se tornarão mais dramáticos ao longo do tempo. Sem que estas condições de estacionaridade sejam satisfeitas, muitos dos cálculos associados ao processo não podem ser calculados. Se um gráfico gráfico dos dados indica nonstationarity, então você deve diferenciar a série. A diferenciação é uma excelente maneira de transformar uma série não-estacionária em uma estacionária. Isto é feito subtraindo a observação no período atual do anterior. Se essa transformação é feita apenas uma vez para uma série, você diz que os dados foram primeiramente diferenciados. Este processo elimina essencialmente a tendência se sua série está crescendo em uma taxa razoavelmente constante. Se ele está crescendo a uma taxa crescente, você pode aplicar o mesmo procedimento e diferença os dados novamente. Seus dados seriam então segundo diferenciados. Autocorrelações são valores numéricos que indicam como uma série de dados está relacionada a si mesma ao longo do tempo. Mais precisamente, ele mede quão fortemente os valores de dados em um número específico de períodos separados estão correlacionados entre si ao longo do tempo. O número de períodos separados é geralmente chamado de atraso. Por exemplo, uma autocorrelação no intervalo 1 mede como os valores 1 intervalo de tempo são correlacionados um ao outro ao longo da série. Uma autocorrelação no intervalo 2 mede como os dados dois períodos separados estão correlacionados ao longo da série. As autocorrelações podem variar de 1 a -1. Um valor próximo a 1 indica uma alta correlação positiva, enquanto um valor próximo de -1 implica uma correlação negativa elevada. Essas medidas são mais frequentemente avaliadas através de gráficos gráficos chamados correlagramas. Um correlagram traça os valores de autocorrelação para uma dada série em diferentes defasagens. Isto é referido como a função de autocorrelação e é muito importante no método ARIMA. A metodologia ARIMA tenta descrever os movimentos em séries temporais estacionárias como uma função do que são chamados parâmetros auto-regressivos e de média móvel. Estes são referidos como parâmetros AR (autoregessive) e parâmetros MA (média móvel). Um modelo AR com apenas 1 parâmetro pode ser escrito como. X (t) A (1) X (t-1) E (t) onde X (t) séries temporais sob investigação A (1) o parâmetro autorregressivo de ordem 1 X (t-1) (T) o termo de erro do modelo Isto simplesmente significa que qualquer valor dado X (t) pode ser explicado por alguma função de seu valor anterior, X (t-1), mais algum erro aleatório inexplicável, E (t). Se o valor estimado de A (1) fosse .30, então o valor atual da série estaria relacionado a 30 de seu valor 1 período atrás. Naturalmente, a série poderia estar relacionada a mais do que apenas um valor passado. Por exemplo, X (t) A (1) X (t-1) A (2) X (t-2) E (t) Isso indica que o valor atual da série é uma combinação dos dois valores imediatamente anteriores, X (t-1) e X (t-2), mais algum erro aleatório E (t). Nosso modelo é agora um modelo autorregressivo de ordem 2. Modelos de média móvel: Um segundo tipo de modelo Box-Jenkins é chamado de modelo de média móvel. Embora estes modelos parecem muito semelhantes ao modelo AR, o conceito por trás deles é bastante diferente. Os parâmetros de média móvel relacionam o que acontece no período t apenas aos erros aleatórios que ocorreram em períodos de tempo passados, isto é, E (t-1), E (t-2), etc., em vez de X (t-1), X T-2), (Xt-3) como nas abordagens autorregressivas. Um modelo de média móvel com um termo MA pode ser escrito da seguinte forma. O termo B (1) é chamado de MA de ordem 1. O sinal negativo na frente do parâmetro é usado apenas para convenção e geralmente é impresso Automaticamente pela maioria dos programas de computador. O modelo acima diz simplesmente que qualquer valor dado de X (t) está diretamente relacionado somente ao erro aleatório no período anterior, E (t-1) e ao termo de erro atual, E (t). Como no caso de modelos autorregressivos, os modelos de média móvel podem ser estendidos a estruturas de ordem superior cobrindo combinações diferentes e comprimentos médios móveis. A metodologia ARIMA também permite a construção de modelos que incorporem parâmetros de média autorregressiva e média móvel. Estes modelos são frequentemente referidos como modelos mistos. Embora isso torne uma ferramenta de previsão mais complicada, a estrutura pode de fato simular melhor a série e produzir uma previsão mais precisa. Modelos puros implicam que a estrutura consiste apenas de AR ou MA parâmetros - não ambos. Os modelos desenvolvidos por esta abordagem são geralmente chamados de modelos ARIMA porque eles usam uma combinação de auto-regressão (RA), integração (I) - referindo-se ao processo inverso de diferenciação para produzir as operações de previsão e de média móvel (MA). Um modelo ARIMA é geralmente indicado como ARIMA (p, d, q). Isso representa a ordem dos componentes autorregressivos (p), o número de operadores de diferenciação (d) e a ordem mais alta do termo médio móvel. Por exemplo, ARIMA (2,1,1) significa que você tem um modelo autorregressivo de segunda ordem com um componente de média móvel de primeira ordem cuja série foi diferenciada uma vez para induzir a estacionaridade. Escolhendo a Especificação Direita: O principal problema no clássico Box-Jenkins está tentando decidir qual especificação ARIMA usar - i. e. Quantos parâmetros AR e / ou MA devem ser incluídos. Isto é o que muito de Box-Jenkings 1976 foi dedicado ao processo de identificação. Ela dependia da avaliação gráfica e numérica das funções de autocorrelação da amostra e autocorrelação parcial. Bem, para os seus modelos básicos, a tarefa não é muito difícil. Cada um tem funções de autocorrelação que parecem uma certa maneira. No entanto, quando você subir em complexidade, os padrões não são tão facilmente detectados. Para tornar as questões mais difíceis, seus dados representam apenas uma amostra do processo subjacente. Isto significa que os erros de amostragem (outliers, erro de medição, etc.) podem distorcer o processo de identificação teórica. É por isso que a modelagem ARIMA tradicional é mais uma arte do que uma ciência. Metodologia Jenkins A metodologia Box-Jenkins usada na análise e na previsão é amplamente considerada a técnica de previsão mais eficiente e é usada extensivamente - especialmente para séries temporais univariadas. A estratégia de três etapas de identificação, estimativa e verificação de diagnóstico. Exige que a pessoa encarregada de produzir previsões tenha experiência e conhecimento. Em contraste com outras técnicas, Box-Jenkins é um procedimento que usa um comportamento de variáveis ​​passadas para selecionar o melhor modelo de previsão de uma classe geral de modelos. Ele assume que qualquer padrão de séries temporais pode ser representado por uma das três categorias de modelos. Estas categorias incluem: 8226 Modelos autorregressivos: previsões de uma variável baseada na função linear de seus valores passados ​​8226 Modelos de média móvel: previsões baseadas na combinação linear de erros passados ​​8226 Modelos de média móvel-automotiva: combinação das duas categorias anteriores Observe que uma das As questões-chave são quantos valores passados ​​(a variável focal e / ou seus erros) devem ser incluídos no modelo. Existem basicamente três etapas para um procedimento Box-Jenkins: 1. Identificar o modelo tentativo. Qual das três categorias listadas acima é identificada como a categoria apropriada é determinada primeiro fazendo os dados estacionários (geralmente diferenciando os dados) e então analisando as autocorrelações e autocorrelações parciais dos dados estacionários. Observe que há autocorrelação teórica e perfis de autocorrelação parcial para cada um dos modelos possíveis. Portanto, determinar o tipo de modelo apropriado para uma situação específica é principalmente uma questão de adequar as correlações observadas às correlações teóricas. 2. Determinação dos parâmetros do modelo. Isto é semelhante à estimativa dos parâmetros na análise de regressão. 3. Aplicação do modelo. Vantagens: Box-Jenkins abordagens para a previsão fornecer algumas das mais precisas previsões de curto prazo. Limitações: No entanto, requer uma quantidade muito grande de dados.

No comments:

Post a Comment