Wednesday 12 July 2017

Autoregressive Moving Average Arma Model


A RIMA significa Autoregressive Integrated Moving Average modelos. Univariada (vetor único) ARIMA é uma técnica de previsão que projeta os valores futuros de uma série baseada inteiramente em sua própria inércia. Sua principal aplicação é na área de previsão de curto prazo, exigindo pelo menos 40 pontos de dados históricos. Ele funciona melhor quando seus dados exibem um padrão estável ou consistente ao longo do tempo com uma quantidade mínima de outliers. Às vezes chamado Box-Jenkins (após os autores originais), ARIMA é geralmente superior às técnicas de suavização exponencial quando os dados são razoavelmente longos ea correlação entre as observações passadas é estável. Se os dados forem curtos ou altamente voláteis, então algum método de alisamento pode funcionar melhor. Se você não tiver pelo menos 38 pontos de dados, você deve considerar algum outro método que ARIMA. O primeiro passo na aplicação da metodologia ARIMA é verificar a estacionaridade. A estacionariedade implica que a série permanece a um nível razoavelmente constante ao longo do tempo. Se existe uma tendência, como na maioria das aplicações econômicas ou de negócios, os dados NÃO são estacionários. Os dados também devem mostrar uma variação constante em suas flutuações ao longo do tempo. Isto é facilmente visto com uma série que é fortemente sazonal e crescendo a um ritmo mais rápido. Nesse caso, os altos e baixos da sazonalidade se tornarão mais dramáticos ao longo do tempo. Sem que estas condições de estacionaridade sejam satisfeitas, muitos dos cálculos associados ao processo não podem ser calculados. Se um gráfico gráfico dos dados indica nonstationarity, então você deve diferenciar a série. A diferenciação é uma excelente maneira de transformar uma série não-estacionária em uma estacionária. Isto é feito subtraindo a observação no período atual do anterior. Se essa transformação é feita apenas uma vez para uma série, você diz que os dados foram primeiro diferenciados. Este processo elimina essencialmente a tendência se sua série está crescendo em uma taxa razoavelmente constante. Se ele está crescendo a uma taxa crescente, você pode aplicar o mesmo procedimento e diferença os dados novamente. Seus dados seriam então segundo diferenciados. Autocorrelações são valores numéricos que indicam como uma série de dados está relacionada a si mesma ao longo do tempo. Mais precisamente, ele mede quão fortemente os valores de dados em um número específico de períodos separados estão correlacionados entre si ao longo do tempo. O número de períodos separados é geralmente chamado de atraso. Por exemplo, uma autocorrelação no intervalo 1 mede como os valores 1 intervalo de tempo são correlacionados um ao outro ao longo da série. Uma autocorrelação no intervalo 2 mede como os dados dois períodos separados estão correlacionados ao longo da série. As autocorrelações podem variar de 1 a -1. Um valor próximo a 1 indica uma alta correlação positiva, enquanto um valor próximo de -1 implica uma correlação negativa elevada. Essas medidas são mais frequentemente avaliadas através de gráficos gráficos chamados correlagramas. Um correlagram traça os valores de autocorrelação para uma dada série em diferentes defasagens. Isto é referido como a função de autocorrelação e é muito importante no método ARIMA. A metodologia ARIMA tenta descrever os movimentos em séries temporais estacionárias como uma função do que são chamados parâmetros auto-regressivos e de média móvel. Estes são referidos como parâmetros AR (autoregessive) e parâmetros MA (média móvel). Um modelo AR com apenas 1 parâmetro pode ser escrito como. X (t) A (1) X (t-1) E (t) onde X (t) séries temporais sob investigação A (1) o parâmetro autorregressivo de ordem 1 X (t-1) (T) o termo de erro do modelo Isto simplesmente significa que qualquer valor dado X (t) pode ser explicado por alguma função de seu valor anterior, X (t-1), mais algum erro aleatório inexplicável, E (t). Se o valor estimado de A (1) fosse .30, então o valor atual da série estaria relacionado a 30 de seu valor 1 período atrás. Naturalmente, a série poderia estar relacionada a mais do que apenas um valor passado. Por exemplo, X (t) A (1) X (t-1) A (2) X (t-2) E (t) Isso indica que o valor atual da série é uma combinação dos dois valores imediatamente anteriores, X (t-1) e X (t-2), mais algum erro aleatório E (t). Nosso modelo é agora um modelo autorregressivo de ordem 2. Modelos de média móvel: Um segundo tipo de modelo Box-Jenkins é chamado de modelo de média móvel. Embora estes modelos parecem muito semelhantes ao modelo AR, o conceito por trás deles é bastante diferente. Os parâmetros de média móvel relacionam o que acontece no período t apenas aos erros aleatórios que ocorreram em períodos de tempo passados, isto é, E (t-1), E (t-2), etc., em vez de X (t-1), X T-2), (Xt-3) como nas abordagens autorregressivas. Um modelo de média móvel com um termo MA pode ser escrito da seguinte forma. O termo B (1) é chamado de MA de ordem 1. O sinal negativo na frente do parâmetro é usado apenas para convenção e geralmente é impresso Automaticamente pela maioria dos programas de computador. O modelo acima diz simplesmente que qualquer valor dado de X (t) está diretamente relacionado somente ao erro aleatório no período anterior, E (t-1) e ao termo de erro atual, E (t). Como no caso dos modelos autorregressivos, os modelos de média móvel podem ser estendidos a estruturas de ordem superior cobrindo diferentes combinações e comprimentos médios móveis. A metodologia ARIMA também permite a construção de modelos que incorporem parâmetros de média autorregressiva e média móvel. Estes modelos são frequentemente referidos como modelos mistos. Embora isso torne uma ferramenta de previsão mais complicada, a estrutura pode de fato simular melhor a série e produzir uma previsão mais precisa. Modelos puros implicam que a estrutura consiste apenas de AR ou MA parâmetros - não ambos. Os modelos desenvolvidos por esta abordagem são geralmente chamados de modelos ARIMA porque eles usam uma combinação de auto-regressão (RA), integração (I) - referindo-se ao processo inverso de diferenciação para produzir as operações de previsão e de média móvel (MA). Um modelo ARIMA é geralmente indicado como ARIMA (p, d, q). Isso representa a ordem dos componentes autorregressivos (p), o número de operadores de diferenciação (d) e a ordem mais alta do termo médio móvel. Por exemplo, ARIMA (2,1,1) significa que você tem um modelo autorregressivo de segunda ordem com um componente de média móvel de primeira ordem cuja série foi diferenciada uma vez para induzir a estacionaridade. Escolhendo a Especificação Direita: O principal problema no clássico Box-Jenkins está tentando decidir qual especificação ARIMA usar - i. e. Quantos parâmetros AR e / ou MA devem ser incluídos. Isto é o que muito de Box-Jenkings 1976 foi dedicado ao processo de identificação. Ela dependia da avaliação gráfica e numérica das funções de autocorrelação da amostra e autocorrelação parcial. Bem, para os seus modelos básicos, a tarefa não é muito difícil. Cada um tem funções de autocorrelação que parecem uma certa maneira. No entanto, quando você subir em complexidade, os padrões não são tão facilmente detectados. Para tornar as questões mais difíceis, seus dados representam apenas uma amostra do processo subjacente. Isto significa que os erros de amostragem (outliers, erro de medição, etc.) podem distorcer o processo de identificação teórica. É por isso que a modelagem ARIMA tradicional é uma arte, em vez de uma ciência. Média Movente Médio Progressivo Modelos ARMA (p, q) para a Análise de Série de Tempo - Parte 3 Este é o terceiro e último post da mini-série sobre ARMA (Autoregressive Moving Average) Modelos de análise de séries temporais. Weve introduziu modelos Autoregressive e modelos de média móvel nos dois artigos anteriores. Agora é hora de combiná-los para produzir um modelo mais sofisticado. Em última análise, isso nos levará aos modelos ARIMA e GARCH que nos permitirão prever os retornos dos ativos e prever a volatilidade. Estes modelos constituirão a base para sinais de negociação e técnicas de gestão de risco. Se você leu Parte 1 e Parte 2 você terá visto que tendemos a seguir um padrão para a nossa análise de um modelo de série de tempo. III repeti-lo brevemente aqui: Justificativa - Por que estamos interessados ​​neste modelo específico Definição - Uma definição matemática para reduzir a ambigüidade. Correlograma - Traçar um correlograma de amostra para visualizar o comportamento de um modelo. Simulação e Montagem - Ajustar o modelo a simulações, para garantir que entendemos o modelo corretamente. Dados financeiros reais - Aplicar o modelo aos preços dos ativos reais reais. Previsão - Previsão de valores subseqüentes para construir sinais de negociação ou filtros. Para seguir este artigo, é aconselhável dar uma olhada nos artigos anteriores sobre análise de séries temporais. Todos podem ser encontrados aqui. Critério Bayesiano de Informações Na Parte 1 deste artigo, analisámos o Critério de Informação Akaike (AIC) como um meio de nos ajudar a escolher entre os melhores modelos de séries temporais. Uma ferramenta estreitamente relacionada é o critério Bayesiano de Informação (BIC). Essencialmente, tem comportamento semelhante ao AIC, pois penaliza os modelos por terem muitos parâmetros. Isso pode levar a superalimentação. A diferença entre o BIC eo AIC é que o BIC é mais rigoroso com a sua penalização de parâmetros adicionais. Critério Bayesiano de Informações Se tomarmos a função de verossimilhança para um modelo estatístico, que tenha k parâmetros, e L maximize a probabilidade. Então o critério Bayesiano de Informação é dado por: Onde n é o número de pontos de dados na série temporal. Estaremos usando o AIC eo BIC abaixo ao escolher modelos ARMA (p, q) apropriados. Teste da Ljung-Box Na parte 1 deste artigo, Rajan mencionou nos comentários de Disqus que o teste de Ljung-Box era mais apropriado do que usar o Critério de Informação Akaike do Critério de Informação Bayesiano para decidir se um modelo ARMA era um bom ajuste para um tempo série. O teste de Ljung-Box é um teste de hipóteses clássico que é projetado para testar se um conjunto de autocorrelações de um modelo de séries temporais ajustadas diferem significativamente de zero. O teste não testa cada atraso individual para aleatoriedade, mas sim testa a aleatoriedade sobre um grupo de defasagens. Teste de Ljung-Box Definimos a hipótese nula como: Os dados da série de tempo em cada lag são i. i.d .. ou seja, as correlações entre os valores da série de população são zero. Definimos a hipótese alternativa como: Os dados da série de tempo não são i. i.d. E possuem correlação serial. Calculamos a seguinte estatística de teste. Q: Onde n é o comprimento da amostra de séries temporais, chapéu k é a autocorrelação da amostra com atraso k e h é o número de defasagens no teste. A regra de decisão sobre se rejeitar a hipótese nula é verificar se Q gt chi2, para uma distribuição qui-quadrado com h graus de liberdade no percentil 100 (1-alfa). Embora os detalhes do teste possam parecer um pouco complexos, podemos de fato usar R para calcular o teste para nós, simplificando um pouco o procedimento. Agora que discutimos o BIC eo teste de Ljung-Box, estávamos prontos para discutir o nosso primeiro modelo misto, ou seja, a Média Móvel Autoresgressiva de ordem p, q, ou ARMA (p, Q). Até o momento, consideramos processos autorregressivos e processos de média móvel. O modelo anterior considera seu próprio comportamento passado como insumos para o modelo e, como tal, tenta capturar efeitos de participantes no mercado, como momentum e reversão média na negociação de ações. O último modelo é usado para caracterizar informações de choque em uma série, como um anúncio de ganhos surpresa ou evento inesperado (como o derramamento de óleo BP Deepwater Horizon). Assim, um modelo ARMA tenta capturar ambos os aspectos ao modelar séries de tempo financeiro. Observe que um modelo ARMA não leva em conta o agrupamento de volatilidade, um fenômeno empírico-chave de muitas séries de tempo financeiro. Não é um modelo condicionalmente heteroscedástico. Para isso teremos de esperar pelos modelos ARCH e GARCH. Definição O modelo ARMA (p, q) é uma combinação linear de dois modelos lineares e, portanto, é ainda linear: Modelo de ordem temporal p, q Um modelo de série temporal, é um modelo de média móvel autorregressiva de ordem p, q . Onde está o ruído branco com E (wt) 0 e variância sigma2. Onde está o ruído branco com E (wt) 0 e variância sigma2. Se considerarmos o operador de mudança de marcha para trás. (Veja um artigo anterior), então podemos reescrever o acima como uma função theta e phi de: Podemos ver diretamente que, ao definir p neq 0 e q0, recuperamos o modelo AR (p). Da mesma forma, se definimos p 0 e q neq 0, recuperamos o modelo MA (q). Uma das principais características do modelo ARMA é que ele é parcimonioso e redundante em seus parâmetros. Ou seja, um modelo ARMA, muitas vezes, exigem menos parâmetros do que um modelo AR (p) ou MA (q) sozinho. Além disso, se reescrevemos a equação em termos da BSO, então os polinômios theta e phi podem às vezes compartilhar um fator comum, levando assim a um modelo mais simples. Simulações e Correlogramas Como com os modelos de média autorregressiva e móvel, agora simularemos várias séries ARMA e, em seguida, tentaremos ajustar os modelos ARMA a essas realizações. Nós realizamos isso porque queremos garantir que compreendemos o procedimento de montagem, incluindo como calcular intervalos de confiança para os modelos, bem como garantir que o procedimento realmente recupera estimativas razoáveis ​​para os parâmetros ARMA originais. Na Parte 1 e Parte 2 construímos manualmente as séries AR e MA tirando N amostras de uma distribuição normal e, em seguida, criando o modelo de série temporal específico usando atrasos dessas amostras. No entanto, há uma maneira mais simples de simular AR, MA, ARMA e ARIMA dados, simplesmente usando o método arima. sim em R. Vamos começar com o mais simples possível não trivial ARMA modelo, ou seja, o ARMA (1,1 ) modelo. Ou seja, um modelo autorregressivo de ordem um combinado com um modelo de média móvel de ordem um. Tal modelo tem apenas dois coeficientes, alfa e beta, que representam os primeiros desfasamentos da série de tempo em si e os termos de ruído de choque branco. Esse modelo é dado por: Precisamos especificar os coeficientes antes da simulação. Vamos pegar alpha 0.5 e beta -0.5: A saída é a seguinte: Permite também plotar o correlograma: Podemos ver que não há autocorrelação significativa, o que é esperado de um modelo ARMA (1,1). Finalmente, vamos tentar determinar os coeficientes e seus erros padrão usando a função arima: Podemos calcular os intervalos de confiança para cada parâmetro usando os erros padrão: Os intervalos de confiança contêm os valores dos parâmetros verdadeiros para ambos os casos, no entanto, 95 intervalos de confiança são muito amplos (uma consequência dos erros padrão razoavelmente grandes). Vamos agora tentar um ARMA (2,2) modelo. Ou seja, um modelo AR (2) combinado com um modelo MA (2). Precisamos especificar quatro parâmetros para este modelo: alfa1, alfa2, beta1 e beta2. Vamos pegar alpha1 0.5, alpha2-0.25 beta10.5 e beta2-0.3: A saída do nosso modelo ARMA (2,2) é a seguinte: E a autocorelação correspondente: Agora podemos tentar montar um modelo ARMA (2,2) para Os dados: Também podemos calcular os intervalos de confiança para cada parâmetro: Observe que os intervalos de confiança para os coeficientes para a componente média móvel (beta1 e beta2) não contêm realmente o valor do parâmetro original. Contudo, para fins comerciais, precisamos apenas de um poder preditivo que exceda o acaso e produza lucros suficientes acima dos custos de transação, a fim de ser rentável em termos de custos. A longo prazo. Agora que temos visto alguns exemplos de modelos ARMA simulados, precisamos de um mecanismo para escolher os valores de p e q quando se encaixam nos modelos a dados financeiros reais. Escolhendo o melhor modelo ARMA (p, q) Para determinar qual ordem p, q do modelo ARMA é apropriada para uma série, precisamos usar o AIC (ou BIC) em um subconjunto de valores para p, q e Em seguida, aplicar o teste Ljung-Box para determinar se um bom ajuste foi alcançado, para valores específicos de p, q. Para mostrar este método, vamos primeiro simular um determinado processo ARMA (p, q). Vamos então fazer um loop sobre todos os valores pairwise de p in e q in e calcular o AIC. Vamos selecionar o modelo com o menor AIC e, em seguida, executar um teste Ljung-Box sobre os resíduos para determinar se conseguimos um bom ajuste. Vamos começar simulando uma série ARMA (3,2): Agora vamos criar um objeto final para armazenar o melhor ajuste do modelo eo menor valor AIC. Percorremos as várias combinações p, q e usamos o objeto atual para armazenar o ajuste de um modelo ARMA (i, j), para as variáveis ​​looping i e j. Se o AIC atual for menor do que qualquer AIC previamente calculado, definimos o AIC final para este valor atual e selecionamos essa ordem. Após a terminação do laço, temos a ordem do modelo ARMA armazenado em final. order e o ARIMA (p, d, q) se encaixa (com o componente d integrado definido como 0) armazenado como final. arma: Deixa a saída do AIC , Ordem e coeficientes ARIMA: Podemos ver que a ordem original do modelo ARMA simulado foi recuperada, nomeadamente com p3 e q2. Podemos traçar o corelograma dos resíduos do modelo para ver se eles parecem uma realização de ruído branco discreto (DWN): O corelograma realmente parece uma realização de DWN. Finalmente, realizamos o teste Ljung-Box para 20 lags para confirmar isso: Observe que o valor p é maior que 0,05, o que indica que os resíduos são independentes no nível 95 e, portanto, um modelo ARMA (3,2) fornece um Bom ajuste do modelo. É claro que este deve ser o caso, uma vez que weve simulado os dados nós mesmos No entanto, este é precisamente o procedimento que vamos usar quando chegarmos a ajustar modelos ARMA (p, q) para o índice SampP500 na próxima seção. Dados Financeiros Agora que descrevemos o procedimento para escolher o modelo de série temporal ideal para uma série simulada, é bastante simples aplicá-lo aos dados financeiros. Para este exemplo, vamos escolher mais uma vez o SampP500 US Equity Index. Permite fazer o download dos preços de fechamento diários usando o quantmod e, em seguida, criar o fluxo de retorno do log: Permite executar o mesmo procedimento de ajuste que para a série ARMA (3,2) simulada acima no log retorna série do SampP500 usando o AIC: Tem a ordem ARMA (3,3): Permite traçar os resíduos do modelo ajustado para o fluxo de retorno diário do log SampP500: Observe que há alguns picos significativos, especialmente em defasagens maiores. Isto é indicativo de um ajuste pobre. Vamos realizar um teste de Ljung-Box para ver se temos evidências estatísticas para isso: Como nós suspeitamos, o valor p é menor que 0,05 e, como tal, não podemos dizer que os resíduos são uma realização de ruído branco discreto. Portanto, há autocorrelação adicional nos resíduos que não é explicada pelo modelo ARMA (3,3) ajustado. Próximas Etapas Como discutimos ao longo desta série de artigos, vimos evidências de heterocedasticidade condicional (agrupamento de volatilidade) na série SampP500, especialmente nos períodos em torno de 2007-2008. Quando usamos um modelo GARCH mais adiante na série de artigos, veremos como eliminar essas autocorrelações. Na prática, os modelos ARMA nunca são geralmente bons ajustes para retorno de ações log. Precisamos levar em conta a heterocedasticidade condicional e usar uma combinação de ARIMA e GARCH. O próximo artigo irá considerar ARIMA e mostrar como o componente integrado difere do modelo ARMA que temos considerado neste artigo. Clique abaixo para saber mais sobre. A informação contida neste site é a opinião dos autores individuais com base em sua observação pessoal, pesquisa e anos de experiência. O editor e seus autores não são conselheiros de investimentos, advogados, CPAs ou outros profissionais de serviços financeiros registrados e não prestam serviços jurídicos, fiscais, contábeis, de investimento ou outros serviços profissionais. As informações oferecidas por este site são apenas educação geral. Porque cada situação factual dos indivíduos é diferente o leitor deve procurar seu próprio conselheiro pessoal. Nem o autor nem o editor assumem qualquer responsabilidade por quaisquer erros ou omissões e não têm responsabilidade nem responsabilidade perante qualquer pessoa ou entidade em relação a danos causados ​​ou alegadamente causados ​​directa ou indirectamente pelas informações contidas neste site. Use por sua conta e risco. Além disso, este site pode receber compensação financeira das empresas mencionadas através de publicidade, programas afiliados ou de outra forma. As tarifas e ofertas dos anunciantes mostrados neste website mudam com freqüência, às vezes sem aviso prévio. Enquanto nos esforçamos para manter informações precisas e oportunas, os detalhes da oferta podem estar desatualizados. Os visitantes devem assim verificar os termos de tais ofertas antes de participar neles. O autor e seu editor não se responsabilizam por atualizar informações e renunciarem a responsabilidade por conteúdo, produtos e serviços de terceiros, inclusive quando acessados ​​por meio de hiperlinks e / ou anúncios neste site. Modelos ARMA (p, q) - Parte 2 Na Parte 1 consideramos o modelo autorregressivo de ordem p, também conhecido como modelo AR (p). Nós o introduzimos como uma extensão do modelo de caminhada aleatória, numa tentativa de explicar a correlação serial adicional em séries de tempo financeiras. Finalmente percebemos que não era suficientemente flexível para capturar verdadeiramente toda a autocorrelação nos preços de fechamento da Amazon Inc. (AMZN) e do SampP500 US Equity Index. A principal razão para isso é que ambos os ativos são condicionalmente heteroskedastic. O que significa que eles são não-estacionários e têm períodos de variância variável ou agrupamento de volatilidade, o que não é levado em conta pelo modelo AR (p). Em futuros artigos, acabaremos construindo os modelos ARREM (Intelligent Moving Average), bem como os modelos condicionalmente heterocedasti - cos das famílias ARCH e GARCH. Esses modelos nos fornecerão nossas primeiras tentativas realistas de prever os preços dos ativos. Neste artigo, no entanto, vamos introduzir a média móvel de ordem q modelo, conhecido como MA (q). Este é um componente do modelo ARMA mais geral e, como tal, precisamos entendê-lo antes de avançar. Eu recomendo que você leia os artigos anteriores na coleção de Análise de Série de Tempo se você não tiver feito isso. Todos podem ser encontrados aqui. Modelos de Ordem Mínima (MA) de ordem q Um modelo de Média Móvel é semelhante a um modelo Autoregressivo, exceto que em vez de ser uma combinação linear de valores de séries temporais passadas, é uma combinação linear dos termos de ruído branco passado. Intuitivamente, isso significa que o modelo MA vê tais choques de ruído branco aleatório diretamente em cada valor atual do modelo. Isto contrasta com um modelo AR (p), onde os choques de ruído branco são vistos apenas indiretamente. Via regressão em termos anteriores da série. Uma diferença chave é que o modelo MA só verá os últimos q choques para qualquer modelo MA (q) particular, enquanto que o modelo AR (p) terá todos os choques anteriores em conta, embora de uma forma decrescentemente fraca. Definição Matematicamente, o MA (q) é um modelo de regressão linear e é similarmente estruturado para AR (p): Modelo de Ordem Mínima de ordem q Um modelo de séries temporais, é um modelo de média móvel de ordem q. MA (q), se: begin xt wt beta1 w ldots betaq w final Onde está o ruído branco com E (wt) 0 e variância sigma2. Se considerarmos o operador de mudança de marcha para trás. (Veja um artigo anterior), então podemos reescrever o acima como uma função phi de: begin xt (1 beta1 beta2 2 ldots betaq q) wt phiq () wt end Nós faremos uso da função phi em artigos posteriores. Propriedades de Segunda Ordem Como com AR (p) a média de um processo MA (q) é zero. Isso é fácil de ver como a média é simplesmente uma soma de meios de termos de ruído branco, que são todos eles próprios zero. Começar o texto enspace mux E (xt) sum E (wi) 0 fim começar texto enspace sigma2w (1 beta21 ldots beta2q) end texto enspace rhok esquerda 1 texto enspace k 0 sum betai beta / sumq beta2i texto enspace k 1, ldots, q 0 Texto enspace k gt q fim direito. Onde beta0 1. Agora vamos gerar alguns dados simulados e usá-lo para criar correlogramas. Isso fará com que a fórmula acima para rhok um pouco mais concreto. Simulações e Correlogramas Vamos começar com um processo MA (1). Se definimos beta1 0.6 obtemos o seguinte modelo: Como com os modelos AR (p) no artigo anterior podemos usar R para simular tal série e então plotar o correlograma. Desde weve tinha um monte de prática na série de artigo anterior série de análise de série de realização de lotes, vou escrever o código R em pleno, em vez de dividi-lo: A saída é a seguinte: Como vimos acima na fórmula para rhok , Para k gt q, todas as autocorrelações devem ser zero. Uma vez que q 1, devemos ver um pico significativo em k1 e, em seguida, picos insignificantes subsequentes a isso. No entanto, devido ao viés de amostragem, deve-se esperar 5 picos (marginalmente) significativos num gráfico de autocorrelação da amostra. Isto é precisamente o que o correlograma nos mostra neste caso. Temos um pico significativo em k1 e então picos insignificantes para k gt 1, exceto em k4 onde temos um pico marginalmente significativo. De fato, esta é uma maneira útil de ver se um modelo de MA (q) é apropriado. Analisando o correlograma de uma série particular, podemos ver quantos atrasos sequenciais não nulos existem. Se q tais defasagens existem, então podemos legitimamente tentar ajustar um modelo MA (q) a uma série particular. Já que temos evidências de nossos dados simulados de um processo MA (1), agora vamos tentar e ajustar um modelo MA (1) para os nossos dados simulados. Infelizmente, não há um comando ma equivalente ao comando ar de modelo autorregressivo em R. Em vez disso, devemos usar o comando arima mais geral e definir os componentes auto-regressivos e integrados como zero. Fazemos isso criando um 3-vetor e definindo os dois primeiros componentes (os parâmetros autogressivos e integrados, respectivamente) a zero: Recebemos alguma saída útil do comando arima. Em primeiro lugar, podemos ver que o parâmetro foi estimado como hat 0.602, que é muito próximo ao verdadeiro valor de beta1 0.6. Em segundo lugar, os erros-padrão já estão calculados para nós, tornando-se fácil calcular intervalos de confiança. Em terceiro lugar, recebemos uma variância estimada, log-verossimilhança e critério de informação Akaike (necessário para a comparação de modelos). A principal diferença entre arima e ar é que a arima estima um termo de interceptação porque não subtrai o valor médio da série. Portanto, precisamos ter cuidado ao realizar as previsões usando o comando arima. Bem, volte a este ponto mais tarde. Como uma verificação rápida estavam indo para calcular os intervalos de confiança para hat: Podemos ver que o intervalo de confiança 95 contém o valor do parâmetro verdadeiro de beta1 0,6 e assim podemos julgar o modelo um bom ajuste. Obviamente isso deve ser esperado desde que nós simulamos os dados em primeiro lugar Como as coisas mudam se modificarmos o sinal de beta1 para -0.6 Vamos realizar a mesma análise: A saída é a seguinte: Podemos ver que em k1 temos um significado Pico no correlograma, exceto que ele mostra correlação negativa, como wed esperar de um MA (1) modelo com primeiro coeficiente negativo. Mais uma vez todos os picos além de k1 são insignificantes. Vamos ajustar um modelo MA (1) e estimar o parâmetro: hat -0.730, que é uma pequena subestimação de beta1 -0.6. Finalmente, vamos calcular o intervalo de confiança: Podemos ver que o valor do parâmetro verdadeiro de beta1-0.6 está contido dentro do intervalo de confiança de 95, fornecendo-nos evidências de um bom ajuste de modelo. Permite executar o mesmo procedimento para um processo MA (3). Desta vez, devemos esperar picos significativos em k em, e picos insignificantes para k gt 3. Vamos usar os seguintes coeficientes: beta1 0,6, beta2 0,4 e beta3 0,2. Vamos simular um processo MA (3) a partir deste modelo. Ive aumentou o número de amostras aleatórias para 1000 nesta simulação, o que torna mais fácil ver a verdadeira estrutura de autocorrelação, à custa de tornar a série original mais difícil de interpretar: A saída é a seguinte: Como esperado, os três primeiros picos são significativos . No entanto, assim é o quarto. Mas podemos legitimamente sugerir que isso pode ser devido ao viés de amostragem como esperamos ver 5 dos picos sendo significativo para além de kq. Vamos agora ajustar um modelo MA (3) para os dados para tentar estimar parâmetros: As estimativas hat 0.544, hat 0.345 e hat 0.298 estão perto dos valores verdadeiros de beta10.6, beta20.4 e beta30.3, respectivamente. Podemos também produzir intervalos de confiança usando os respectivos erros padrão: Em cada caso, os 95 intervalos de confiança contêm o verdadeiro valor do parâmetro e podemos concluir que temos um bom ajuste com nosso modelo MA (3), como seria de se esperar. Dados Financeiros Na Parte 1 consideramos a Amazon Inc. (AMZN) e o SampP500 US Equity Index. Nós ajustamos o modelo AR (p) a ambos e descobrimos que o modelo foi incapaz de capturar efetivamente a complexidade da correlação serial, especialmente no elenco do SampP500, onde os efeitos de memória longa parecem estar presentes. Eu não vou traçar os gráficos novamente para os preços e autocorrelação, em vez disso eu vou encaminhá-lo para o post anterior. Amazon Inc. (AMZN) Vamos começar por tentar ajustar uma seleção de MA (q) modelos para AMZN, ou seja, com q em. Como na Parte 1, bem use quantmod para baixar os preços diários para AMZN e depois convertê-los em um log retorna fluxo de preços de fechamento: Agora que temos o log retorna fluxo podemos usar o comando arima para caber MA (1), MA (2) e MA (3) modelos e, em seguida, estimar os parâmetros de cada um. Para MA (1) temos: Podemos traçar os resíduos dos retornos do registro diário e do modelo ajustado: Observe que temos alguns picos significativos nos retornos k2, k11, k16 e k18, indicando que o modelo MA (1) é Improvável de ser um bom ajuste para o comportamento do log AMZN retorna, uma vez que isso não se parece com uma realização de ruído branco. Vamos tentar um modelo MA (2): Ambas as estimativas para os coeficientes beta são negativas. Vamos plotar os resíduos uma vez mais: Podemos ver que há quase zero autocorrelação nos primeiros poucos retornos. No entanto, temos cinco picos marginalmente significativos nos retornos k12, k16, k19, k25 e k27. Isto é sugestivo que o modelo MA (2) está a capturar uma grande parte da autocorrelação, mas não todos os efeitos de memória longa. Como sobre um modelo de MA (3) Uma vez mais, podemos traçar os resíduos: O gráfico de MA (3) residuais parece quase idêntico ao do modelo MA (2). Isso não é surpreendente, assim como a adição de um novo parâmetro a um modelo que aparentemente explicou muitas das correlações em defasagens mais curtas, mas isso não terá muito efeito sobre os atrasos de longo prazo. Toda esta evidência é sugestiva do fato de que um modelo de MA (q) é improvável que seja útil para explicar toda a correlação serial isoladamente. Pelo menos para AMZN. SampP500 Se você se lembrar, na Parte 1 vimos que a primeira ordem diferenciada log diário retorna estrutura do SampP500 possuía muitos picos significativos em vários desfasamentos, tanto curto como longo. Isto proporcionou evidências de heterocedasticidade condicional (isto é, agrupamento de volatilidade) e efeitos de memória longa. Conclui-se que o modelo AR (p) foi insuficiente para captar toda a autocorrelação presente. Como vimos acima o modelo MA (q) foi insuficiente para capturar correlação serial adicional nos resíduos do modelo ajustado para a série de preços de log diário diferenciado de primeira ordem. Vamos agora tentar ajustar o modelo MA (q) ao SampP500. Pode-se perguntar por que estamos fazendo isso é se sabemos que é improvável que seja um bom ajuste. Essa é uma boa pergunta. A resposta é que precisamos ver exatamente como ele não é um bom ajuste, porque este é o processo final que estaremos seguindo quando nos depararmos com modelos muito mais sofisticados, que são potencialmente mais difíceis de interpretar. Vamos começar por obter os dados e convertê-lo para uma série de primeira ordem diferenciada de logaritmicamente transformado preços de fechamento diário como no artigo anterior: Agora vamos ajustar um modelo MA (1), MA (2) e MA (3) para A série, como fizemos acima para AMZN. Vamos começar com MA (1): Vamos fazer um gráfico dos resíduos deste modelo ajustado: O primeiro pico significativo ocorre em k2, mas há muitos mais em k em. Isto claramente não é uma percepção de ruído branco e por isso devemos rejeitar o modelo MA (1) como um potencial bom ajuste para o SampP500. A situação melhora com MA (2) Mais uma vez, vamos fazer um gráfico dos resíduos deste modelo ajustado MA (2): Enquanto o pico em k2 desapareceu (como wed esperar), ainda estamos com os picos significativos em Muitos atrasos mais longos nos resíduos. Mais uma vez, encontramos o modelo MA (2) não é um bom ajuste. Devemos esperar, para o modelo MA (3), ver menos correlação serial em k3 do que para o MA (2), mas mais uma vez também devemos esperar nenhuma redução em defasagens adicionais. Finalmente, fazemos um gráfico dos resíduos deste modelo ajustado MA (3): Isto é precisamente o que vemos no correlograma dos resíduos. Daí o MA (3), como com os outros modelos acima, não é um bom ajuste para o SampP500. Próximas Etapas Examinamos agora em detalhe dois grandes modelos de séries temporais, a saber, o modelo Autogressivo de ordem p, AR (p) e então Média Móvel de ordem q, MA (q). Nós vimos que eles são ambos capazes de explicar algumas das autocorrelações nos resíduos de primeira ordem diferenciados diariamente log preços de ações e índices, mas volatilidade clusterização e memória longa efeitos persistem. É finalmente o momento de voltar nossa atenção para a combinação destes dois modelos, ou seja, a Média Móvel Autoresgressiva de ordem p, q, ARMA (p, q) para ver se ela vai melhorar a situação ainda mais. No entanto, teremos que esperar até o próximo artigo para uma discussão completa Clique abaixo para saber mais sobre. A informação contida neste site é a opinião dos autores individuais com base em sua observação pessoal, pesquisa e anos de experiência. O editor e seus autores não são conselheiros de investimentos, advogados, CPAs ou outros profissionais de serviços financeiros registrados e não prestam serviços jurídicos, fiscais, contábeis, de investimento ou outros serviços profissionais. As informações oferecidas por este site são apenas educação geral. Porque cada situação factual dos indivíduos é diferente o leitor deve procurar seu próprio conselheiro pessoal. Nem o autor nem o editor assumem qualquer responsabilidade por quaisquer erros ou omissões e não têm responsabilidade nem responsabilidade perante qualquer pessoa ou entidade em relação a danos causados ​​ou alegadamente causados ​​directa ou indirectamente pelas informações contidas neste site. Use por sua conta e risco. Além disso, este site pode receber compensação financeira das empresas mencionadas através de publicidade, programas afiliados ou de outra forma. As tarifas e ofertas dos anunciantes mostrados neste website mudam com freqüência, às vezes sem aviso prévio. Enquanto nos esforçamos para manter informações precisas e oportunas, os detalhes da oferta podem estar desatualizados. Os visitantes devem assim verificar os termos de tais ofertas antes de participar neles. O autor e seu editor não se responsabilizam por atualizar informações e renunciarem a responsabilidade por conteúdo, produtos e serviços de terceiros, inclusive quando acessados ​​por meio de hiperlinks e / ou anúncios neste site.

No comments:

Post a Comment