Monday 26 March 2018

5 point moving average smoothing


Média móvel Este exemplo ensina como calcular a média móvel de uma série temporal no Excel. Um avarge movente é usado para suavizar irregularidades (picos e vales) para reconhecer facilmente as tendências. 1. Primeiro, vamos dar uma olhada em nossa série temporal. 2. Na guia Dados, clique em Análise de dados. Nota: não é possível localizar o botão Análise de dados Clique aqui para carregar o suplemento Analysis ToolPak. 3. Selecione Média Móvel e clique em OK. 4. Clique na caixa Intervalo de entrada e selecione o intervalo B2: M2. 5. Clique na caixa Interval (Intervalo) e digite 6. 6. Clique na caixa Output Range (Intervalo de saída) e selecione a célula B3. 8. Plote um gráfico desses valores. Explicação: porque definimos o intervalo para 6, a média móvel é a média dos 5 pontos de dados anteriores e do ponto de dados atual. Como resultado, picos e vales são suavizados. O gráfico mostra uma tendência crescente. O Excel não pode calcular a média móvel dos primeiros 5 pontos de dados porque não há pontos de dados anteriores suficientes. 9. Repita os passos 2 a 8 para o intervalo 2 e intervalo 4. Conclusão: Quanto maior o intervalo, mais os picos e vales são suavizados. Quanto menor o intervalo, mais próximas as médias móveis dos pontos de dados reais. Movendo modelos de suavização média e exponencial Como um primeiro passo para ir além dos modelos de média, modelos de passeio aleatório e modelos de tendência linear, padrões e tendências não sazonais podem ser extrapolados usando um modelo de média móvel ou suavização. A suposição básica por trás dos modelos de média e suavização é que a série temporal é localmente estacionária com uma média de variação lenta. Assim, tomamos uma média móvel (local) para estimar o valor atual da média e, em seguida, usamos isso como a previsão para o futuro próximo. Isso pode ser considerado como um compromisso entre o modelo de média e o modelo de passeio aleatório sem deriva. A mesma estratégia pode ser usada para estimar e extrapolar uma tendência local. Uma média móvel é muitas vezes chamada de uma versão quotsmoothed da série original porque a média de curto prazo tem o efeito de suavizar os solavancos da série original. Ao ajustar o grau de suavização (a largura da média móvel), podemos esperar encontrar algum tipo de equilíbrio ideal entre o desempenho dos modelos de caminhada média e aleatória. O tipo mais simples de modelo de média é o. Média Móvel Simples (igualmente ponderada): A previsão para o valor de Y no tempo t1 que é feito no tempo t é igual à média simples das observações mais recentes: (Aqui e em outros lugares eu usarei o símbolo 8220Y-hat8221 para ficar para uma previsão da série temporal Y feita o mais cedo possível por um dado modelo.) Esta média é centrada no período t - (m1) / 2, o que implica que a estimativa da média local tenderá a ficar atrás da valor verdadeiro da média local em cerca de (m1) / 2 períodos. Assim, dizemos que a idade média dos dados na média móvel simples é (m1) / 2 em relação ao período para o qual a previsão é calculada: é a quantidade de tempo que as previsões tenderão a ficar para trás nos pontos de virada no dados. Por exemplo, se você está calculando a média dos últimos 5 valores, as previsões serão aproximadamente 3 períodos mais tarde para responder aos pontos de virada. Observe que, se m1, o modelo de média móvel simples (SMA) é equivalente ao modelo de passeio aleatório (sem crescimento). Se m é muito grande (comparável à duração do período de estimativa), o modelo SMA é equivalente ao modelo de média. Como acontece com qualquer parâmetro de um modelo de previsão, é costume ajustar o valor de k para obter o melhor quotfit dos dados, ou seja, os menores erros de previsão, em média. Aqui está um exemplo de uma série que parece exibir flutuações aleatórias em torno de uma média de variação lenta. Primeiro, vamos tentar ajustá-lo com um modelo de passeio aleatório, o que equivale a uma média móvel simples de 1 termo: o modelo de passeio aleatório responde muito rapidamente a mudanças na série, mas ao fazê-lo ele escolhe muito da cotação na série. dados (as flutuações aleatórias), bem como o quotsignalquot (a média local). Se, em vez disso, tentarmos uma média móvel simples de 5 termos, obteremos um conjunto de previsões mais suave: a média móvel simples de 5 termos gera erros significativamente menores do que o modelo de passeio aleatório nesse caso. A idade média dos dados nesta previsão é de 3 ((51) / 2), de modo que ela tende a ficar atrás de pontos de virada em cerca de três períodos. (Por exemplo, uma desaceleração parece ter ocorrido no período 21, mas as previsões não mudam até vários períodos depois.) Observe que as previsões de longo prazo do modelo SMA são uma linha reta horizontal, assim como no passeio aleatório. modelo. Assim, o modelo SMA assume que não há tendência nos dados. No entanto, enquanto as previsões do modelo de passeio aleatório são simplesmente iguais ao último valor observado, as previsões do modelo SMA são iguais a uma média ponderada de valores recentes. Os limites de confiança calculados pela Statgraphics para as previsões de longo prazo da média móvel simples não aumentam à medida que o horizonte de previsão aumenta. Isso obviamente não está correto Infelizmente, não há uma teoria estatística subjacente que nos diga como os intervalos de confiança devem se ampliar para esse modelo. No entanto, não é muito difícil calcular estimativas empíricas dos limites de confiança para as previsões de horizonte mais longo. Por exemplo, você poderia configurar uma planilha na qual o modelo do SMA seria usado para prever duas etapas à frente, três etapas à frente etc. na amostra de dados históricos. Você poderia calcular os desvios padrão da amostra dos erros em cada horizonte de previsão e, em seguida, construir intervalos de confiança para previsões de prazo mais longo adicionando e subtraindo múltiplos do desvio padrão apropriado. Se tentarmos uma média móvel simples de 9 termos, obteremos previsões ainda mais suaves e mais um efeito retardado: a idade média é agora de 5 períodos ((91) / 2). Se tomarmos uma média móvel de 19 anos, a idade média aumentará para 10: observe que, de fato, as previsões agora estão atrasadas em relação aos pontos de virada em cerca de 10 períodos. Que quantidade de suavização é melhor para esta série? Aqui está uma tabela que compara suas estatísticas de erro, incluindo também uma média de três termos: Modelo C, a média móvel de 5 termos, produz o menor valor de RMSE por uma pequena margem sobre os 3 A médio e médio prazo, e as outras estatísticas são quase idênticas. Assim, entre os modelos com estatísticas de erros muito semelhantes, podemos escolher se preferiríamos um pouco mais de capacidade de resposta ou um pouco mais de suavidade nas previsões. (Voltar ao topo da página.) Suavização exponencial simples de Browns (média móvel exponencialmente ponderada) O modelo de média móvel simples descrito acima tem a propriedade indesejável de tratar as últimas k observações igualmente e ignorar completamente todas as observações anteriores. Intuitivamente, os dados passados ​​devem ser descontados de forma mais gradual - por exemplo, a observação mais recente deve ter um pouco mais de peso do que o segundo mais recente, e o segundo mais recente deve ter um pouco mais de peso que o terceiro mais recente. em breve. O simples modelo de suavização exponencial (SES) faz isso. Seja 945 denotar uma constante de quotsmoothing (um número entre 0 e 1). Uma maneira de escrever o modelo é definir uma série L que representa o nível atual (ou seja, o valor médio local) da série, conforme estimado a partir dos dados até o presente. O valor de L no tempo t é computado recursivamente a partir de seu próprio valor anterior como este: Assim, o valor atual suavizado é uma interpolação entre o valor suavizado anterior e a observação atual, onde 945 controla a proximidade do valor interpolado com o mais recente. observação. A previsão para o próximo período é simplesmente o valor atual suavizado: equivalentemente, podemos expressar a próxima previsão diretamente em termos de previsões anteriores e observações anteriores, em qualquer uma das seguintes versões equivalentes. Na primeira versão, a previsão é uma interpolação entre previsão anterior e observação anterior: Na segunda versão, a próxima previsão é obtida ajustando a previsão anterior na direção do erro anterior por um valor fracionário 945. é o erro feito em tempo t. Na terceira versão, a previsão é uma média móvel exponencialmente ponderada (ou seja, com desconto) com fator de desconto 1- 945: A versão de interpolação da fórmula de previsão é a mais simples de usar se você estiver implementando o modelo em uma planilha: ela se encaixa em um célula única e contém referências de célula apontando para a previsão anterior, a observação anterior e a célula onde o valor de 945 é armazenado. Observe que, se 945 1, o modelo SES é equivalente a um modelo de passeio aleatório (sem crescimento). Se 945 0, o modelo SES é equivalente ao modelo da média, assumindo que o primeiro valor suavizado é definido como igual à média. (Retornar ao início da página.) A idade média dos dados na previsão de suavização exponencial simples é 1/945 em relação ao período para o qual a previsão é calculada. (Isso não deve ser óbvio, mas pode ser facilmente demonstrado pela avaliação de uma série infinita.) Assim, a previsão da média móvel simples tende a ficar para trás em pontos de virada em cerca de 1/945. Por exemplo, quando 945 0,5 o atraso é de 2 períodos quando 945 0,2 o atraso é de 5 períodos quando 945 0,1 o atraso é de 10 períodos e assim por diante. Para uma determinada idade média (ou seja, quantidade de defasagem), a previsão de suavização exponencial simples (SES) é um pouco superior à previsão de média móvel simples (SMA) porque coloca relativamente mais peso na observação mais recente - isto é. é ligeiramente mais sensível às mudanças que ocorreram no passado recente. Por exemplo, um modelo SMA com 9 termos e um modelo SES com 945 0.2 ambos têm uma idade média de 5 para os dados em suas previsões, mas o modelo SES coloca mais peso nos últimos 3 valores do que o modelo SMA e no mesmo tempo, ele não ignora inteiramente os valores acima de 9 períodos, como mostrado neste gráfico: Outra importante vantagem do modelo SES sobre o modelo SMA é que o modelo SES usa um parâmetro de suavização que é continuamente variável, para que possa ser facilmente otimizado usando um algoritmo quotsolverquot para minimizar o erro quadrático médio. O valor ideal de 945 no modelo SES para esta série é 0.2961, como mostrado aqui: A idade média dos dados nesta previsão é de 1 / 0.2961 3.4 períodos, o que é similar ao de um movimento simples de 6 termos. média. As previsões de longo prazo do modelo SES são uma linha reta horizontal. como no modelo SMA e no modelo de passeio aleatório sem crescimento. No entanto, observe que os intervalos de confiança calculados pela Statgraphics agora divergem de maneira razoável, e que eles são substancialmente mais estreitos do que os intervalos de confiança para o modelo de passeio aleatório. O modelo SES assume que a série é um pouco mais "previsível" do que o modelo de passeio aleatório. Um modelo SES é, na verdade, um caso especial de um modelo ARIMA. Portanto, a teoria estatística dos modelos ARIMA fornece uma base sólida para calcular os intervalos de confiança para o modelo SES. Em particular, um modelo SES é um modelo ARIMA com uma diferença não sazonal, um termo MA (1) e nenhum termo constante. também conhecido como um modelo quotARIMA (0,1,1) sem constante. O coeficiente MA (1) no modelo ARIMA corresponde à quantidade 1-945 no modelo SES. Por exemplo, se você ajustar um modelo ARIMA (0,1,1) sem constante para as séries aqui analisadas, o coeficiente estimado MA (1) será 0,7029, que é quase exatamente um menos 0,2961. É possível adicionar a suposição de uma tendência linear constante diferente de zero a um modelo SES. Para fazer isso, basta especificar um modelo ARIMA com uma diferença não-sazonal e um termo MA (1) com uma constante, ou seja, um modelo ARIMA (0,1,1) com constante. As previsões a longo prazo terão então uma tendência que é igual à tendência média observada ao longo de todo o período de estimativa. Você não pode fazer isso em conjunto com o ajuste sazonal, porque as opções de ajuste sazonal são desabilitadas quando o tipo de modelo é definido como ARIMA. No entanto, você pode adicionar uma tendência exponencial constante de longo prazo a um modelo de suavização exponencial simples (com ou sem ajuste sazonal) usando a opção de ajuste de inflação no procedimento Previsão. A taxa de "inflação" por período pode ser estimada como o coeficiente de inclinação em um modelo de tendência linear ajustado aos dados em conjunto com uma transformação logarítmica natural, ou pode ser baseado em outra informação independente sobre perspectivas de crescimento a longo prazo. . (Voltar ao topo da página) Browns Linear (ie double) Suavização exponencial Os modelos SMA e modelos SES assumem que não há tendência de nenhum tipo nos dados (o que é normalmente OK ou pelo menos não muito mau para 1- previsões antecipadas quando os dados são relativamente ruidosos), e elas podem ser modificadas para incorporar uma tendência linear constante como mostrado acima. E as tendências de curto prazo Se uma série exibe uma taxa variável de crescimento ou um padrão cíclico que se destaca claramente contra o ruído, e se há a necessidade de prever mais de um período à frente, então a estimativa de uma tendência local também pode ser um problema. O modelo de suavização exponencial simples pode ser generalizado para obter um modelo de suavização exponencial linear (LES) que calcula estimativas locais de nível e tendência. O modelo de tendência mais simples e variante no tempo é o modelo de suavização exponencial linear de Brown, que usa duas séries suavizadas diferentes que são centralizadas em diferentes pontos no tempo. A fórmula de previsão é baseada em uma extrapolação de uma linha através dos dois centros. (Uma versão mais sofisticada deste modelo, Holt8217s, é discutida abaixo.) A forma algébrica do modelo de suavização exponencial linear de Brown8217s, como o modelo de suavização exponencial simples, pode ser expressa em várias formas diferentes, mas equivalentes. A forma "padrão" deste modelo é geralmente expressa da seguinte forma: Seja S a série suavemente obtida pela aplicação da suavização exponencial simples à série Y. Ou seja, o valor de S no período t é dado por: (Lembre-se que, sob simples suavização exponencial, essa seria a previsão para Y no período t1.) Então, Squot denota a série suavizada duplamente obtida aplicando suavização exponencial simples (usando o mesmo 945) à série S: Finalmente, a previsão para Y tk. para qualquer kgt1, é dado por: Isto produz e 1 0 (isto é, trapaceie um pouco, e deixe a primeira previsão igual à primeira observação real), e e 2 Y 2 8211 Y 1. após o qual as previsões são geradas usando a equação acima. Isto produz os mesmos valores ajustados que a fórmula baseada em S e S se estes últimos foram iniciados usando S 1 S 1 Y 1. Esta versão do modelo é usada na próxima página que ilustra uma combinação de suavização exponencial com ajuste sazonal. Holt8217s Linear Exponential Smoothing O modelo Brown8217s LES calcula as estimativas locais de nível e tendência suavizando os dados recentes, mas o fato de fazer isso com um único parâmetro de suavização impõe uma restrição nos padrões de dados que ele pode ajustar: o nível e a tendência não é permitido variar em taxas independentes. O modelo LES de Holt8217s resolve esse problema incluindo duas constantes de suavização, uma para o nível e outra para a tendência. A qualquer momento t, como no modelo Brown8217s, existe uma estimativa L t do nível local e uma estimativa T t da tendência local. Aqui eles são calculados recursivamente a partir do valor de Y observado no tempo t e as estimativas anteriores do nível e da tendência por duas equações que aplicam suavização exponencial a elas separadamente. Se o nível e tendência estimados no tempo t-1 são L t82091 e T t-1. respectivamente, então a previsão para Y tshy que teria sido feita no tempo t-1 é igual a L t-1 T t-1. Quando o valor real é observado, a estimativa atualizada do nível é computada de forma recursiva pela interpolação entre Y tshy e sua previsão, L t-1 T t-1, usando pesos de 945 e 1- 945. A mudança no nível estimado, ou seja, L t 8209 L t82091. pode ser interpretado como uma medida ruidosa da tendência no tempo t. A estimativa atualizada da tendência é então calculada recursivamente pela interpolação entre L t 8209 L t82091 e a estimativa anterior da tendência, T t-1. usando pesos de 946 e 1-946: A interpretação da constante de suavização de tendência 946 é análoga àquela da constante de suavização de nível 945. Modelos com valores pequenos de 946 assumem que a tendência muda apenas muito lentamente com o tempo, enquanto modelos com maiores 946 assumem que está mudando mais rapidamente. Um modelo com um grande 946 acredita que o futuro distante é muito incerto, porque os erros na estimativa de tendência tornam-se bastante importantes na previsão de mais de um período à frente. (Retornar ao início da página.) As constantes de suavização 945 e 946 podem ser estimadas da maneira usual minimizando o erro quadrático médio das previsões de 1 passo à frente. Quando isso é feito na Statgraphics, as estimativas são de 945 0,3048 e 946 0,008. O valor muito pequeno de 946 significa que o modelo assume muito pouca mudança na tendência de um período para o outro, então basicamente esse modelo está tentando estimar uma tendência de longo prazo. Por analogia com a noção da idade média dos dados que é usada na estimativa do nível local da série, a idade média dos dados que é usada na estimativa da tendência local é proporcional a 1/946, embora não exatamente igual a isto. Neste caso, isto é 1 / 0,006 125. Isto não é um número muito preciso na medida em que a precisão da estimativa de 946 não é realmente 3 casas decimais, mas é da mesma ordem geral de magnitude que o tamanho da amostra de 100 Portanto, esse modelo está calculando a média de muito da história na estimativa da tendência. O gráfico de previsão abaixo mostra que o modelo LES estima uma tendência local ligeiramente maior no final da série do que a tendência constante estimada no modelo SEStrend. Além disso, o valor estimado de 945 é quase idêntico ao obtido pelo ajuste do modelo SES com ou sem tendência, portanto, esse é quase o mesmo modelo. Agora, essas parecem previsões razoáveis ​​para um modelo que deveria estar estimando uma tendência local? Se você planeja esse gráfico, parece que a tendência local diminuiu no final da série O que aconteceu Os parâmetros deste modelo foram estimados minimizando o erro quadrado das previsões em 1 passo à frente, e não as previsões a longo prazo, caso em que a tendência não faz muita diferença. Se tudo o que você está vendo são erros de 1 passo à frente, você não está vendo a imagem maior das tendências em (digamos) 10 ou 20 períodos. A fim de obter este modelo mais em sintonia com a extrapolação dos dados do nosso globo ocular, podemos ajustar manualmente a constante de suavização de tendência para que ela use uma linha de base mais curta para a estimativa de tendência. Por exemplo, se escolhermos definir 946 0,1, a idade média dos dados usados ​​na estimativa da tendência local é de 10 períodos, o que significa que estamos calculando a média dos últimos 20 períodos. Aqui está o que o gráfico de previsão parece se definirmos 946 0.1 enquanto mantemos 945 0.3. Isto parece intuitivamente razoável para esta série, embora seja provavelmente perigoso extrapolar esta tendência mais do que 10 períodos no futuro. E as estatísticas de erro Aqui está uma comparação de modelo para os dois modelos mostrados acima, bem como três modelos SES. O valor ideal de 945 para o modelo SES é de aproximadamente 0,3, mas resultados semelhantes (com uma maior ou menor responsividade, respectivamente) são obtidos com 0,5 e 0,2. (A) exp. Linear de Holts alisamento com alfa 0,3048 e beta 0,008 (B) Holts linear exp. alisamento com alpha 0.3 e beta 0.1 (C) Alisamento exponencial simples com alpha 0.5 (D) Suavização exponencial simples com alpha 0.3 (E) Suavização exponencial simples com alpha 0.2 Suas estatísticas são quase idênticas, então nós realmente podemos fazer a escolha com base de erros de previsão em um passo à frente na amostra de dados. Temos que recorrer a outras considerações. Se acreditamos firmemente que faz sentido basear a estimativa de tendência atual no que aconteceu nos últimos 20 períodos, podemos fazer um caso para o modelo LES com 945 0.3 e 946 0.1. Se quisermos sermos agnósticos quanto à existência de uma tendência local, então um dos modelos do SES poderá ser mais fácil de explicar e também fornecerá mais previsões do meio do caminho para os próximos 5 ou 10 períodos. (Voltar ao topo da página.) Qual tipo de extrapolação de tendência é melhor: horizontal ou linear Evidências empíricas sugerem que, se os dados já foram ajustados (se necessário) para a inflação, então pode ser imprudente extrapolar o linear de curto prazo tendências muito longe no futuro. Tendências evidentes hoje podem afrouxar no futuro devido a causas variadas, como obsolescência do produto, aumento da concorrência e desacelerações cíclicas ou retomadas em uma indústria. Por essa razão, a suavização exponencial simples geralmente tem melhor desempenho fora da amostra do que seria esperado, apesar de sua extrapolação de tendência horizontal cotativa. Modificações de tendências amortecidas do modelo de suavização exponencial linear também são frequentemente usadas na prática para introduzir uma nota de conservadorismo em suas projeções de tendência. O modelo LES de tendência amortecida pode ser implementado como um caso especial de um modelo ARIMA, em particular, um modelo ARIMA (1,1,2). É possível calcular intervalos de confiança em torno de previsões de longo prazo produzidas por modelos de suavização exponencial, considerando-os como casos especiais de modelos ARIMA. (Cuidado: nem todos os softwares calculam intervalos de confiança para esses modelos corretamente.) A largura dos intervalos de confiança depende (i) do erro RMS do modelo, (ii) do tipo de suavização (simples ou linear) (iii) do valor (s) da (s) constante (s) de suavização e (iv) o número de períodos à frente que você está prevendo. Em geral, os intervalos se espalham mais rápido à medida que o 945 se torna maior no modelo SES e eles se espalham muito mais rápido quando a suavização linear é usada. Este tópico é discutido mais adiante na seção de modelos ARIMA das notas. (Retornar ao início da página.) 5.2 Alisando Séries Temporais A suavização geralmente é feita para nos ajudar a ver melhor padrões, tendências, por exemplo, em séries temporais. Geralmente suavize a aspereza irregular para ver um sinal mais claro. Para dados sazonais, podemos suavizar a sazonalidade para que possamos identificar a tendência. A suavização não nos fornece um modelo, mas pode ser um bom primeiro passo para descrever vários componentes da série. O termo filtro é usado às vezes para descrever um procedimento de suavização. Por exemplo, se o valor suavizado para um determinado tempo é calculado como uma combinação linear de observações para tempos circunvizinhos, pode-se dizer que aplicamos um filtro linear aos dados (não é o mesmo que dizer que o resultado é uma linha reta, o caminho). O uso tradicional do termo média móvel é que, a cada momento, determinamos as médias (possivelmente ponderadas) dos valores observados em torno de um tempo específico. Por exemplo, no tempo t. uma média móvel centrada de comprimento 3 com pesos iguais seria a média dos valores nos tempos t -1. t. e t1. Para tirar a sazonalidade de uma série, para que possamos ver melhor a tendência, usaríamos uma média móvel com um intervalo sazonal de comprimento. Assim, na série suavizada, cada valor suavizado foi calculado em todas as estações. Isso pode ser feito observando-se uma média móvel unilateral na qual você calcula a média de todos os valores para os anos anteriores que valem dados ou uma média móvel centralizada na qual você usa valores antes e depois da hora atual. Para dados trimestrais, por exemplo, poderíamos definir um valor suavizado para o tempo t como (x t x t-1 x t-2 x t-3) / 4, a média desse tempo e os 3 trimestres anteriores. No código R, este será um filtro unilateral. Uma média móvel centrada cria um pouco de dificuldade quando temos um número par de períodos de tempo no período sazonal (como costumamos fazer). Para suavizar a sazonalidade nos dados trimestrais. A fim de identificar a tendência, a convenção usual é usar a média móvel suavizada no tempo t para suavizar a sazonalidade dos dados mensais. Para identificar a tendência, a convenção usual é usar a média móvel suavizada no tempo t. Ou seja, aplicamos o peso 1/24 aos valores nos tempos t6 e t6 e o ​​peso 1/12 em todos os valores em todos os momentos entre t5 e t5. No comando R filter, especifique bem um filtro de dois lados quando quisermos usar valores que vêm antes e depois do tempo para o qual foram suavizados. Observe que na página 71 de nosso livro, os autores aplicam ponderações iguais em uma média móvel sazonal centralizada. Isso também está bem. Por exemplo, um suavizador trimestral pode ser suavizado no tempo t é frat x frac x frac x frac x frac x Um suavizador mensal pode aplicar um peso de 1/13 a todos os valores dos tempos t-6 a t6. O código usado pelos autores na página 72 aproveita um comando rep que repete um valor um determinado número de vezes. Eles não usam o parâmetro filter no comando filter. Exemplo 1 Produção Trimestral de Cerveja na Austrália Na Lição 1 e na Lição 4, analisamos uma série de produção trimestral de cerveja na Austrália. O seguinte código R cria uma série suavizada que nos permite ver o padrão de tendência e plota este padrão de tendência no mesmo gráfico da série temporal. O segundo comando cria e armazena a série suavizada no objeto chamado trendpattern. Observe que, dentro do comando filter, o parâmetro named filter fornece os coeficientes para nossa suavização e os lados 2 fazem com que uma suavidade centralizada seja calculada. beerprod scan (beerprod. dat) filtro de padrão de tendência (beerprod, filtro c (1/8, 1/4, 1/4, 1/4, 1/8), sides2) plotagem (beerprod, tipo b, tendência anual média móvel principal ) lines (trendpattern) Heres o resultado: Podemos subtrair o padrão de tendência dos valores de dados para obter uma melhor visualização da sazonalidade. Veja como isso seria feito: seasonals beerprod - trendpattern plot (seasonals, tipo b, main Padrão sazonal para produção de cerveja) O resultado a seguir: Outra possibilidade de suavizar séries para ver a tendência é o filtro filterpattern2 de filtro unilateral (beerproduto, filtro c (1/4, 1/4, 1/4, 1/4), sides1) Com isso, o valor suavizado é a média do ano passado. Exemplo 2 Desemprego mensal nos EUA Na lição de casa da semana 4, você analisou uma série mensal de desemprego nos EUA de 1948 a 1978. Aqui está uma suavização feita para observar a tendência. trendunemployfilter (desempregado, filterc (1 / 24,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12,1 / 12, 1 / 12,1 / 24), sides2) trendunemploy st (trendunemploy, start c (1948,1), freq 12) plot (trendunemploy, mainTrend in US Desemprego, 1948-1978, xlab Year) Apenas a tendência suavizada é plotada. O segundo comando identifica as características do tempo do calendário da série. Isso faz com que o enredo tenha um eixo mais significativo. O enredo segue. Para séries não sazonais, você não é obrigado a suavizar qualquer período específico. Para suavizar, você deve experimentar médias móveis de diferentes extensões. Esses períodos de tempo podem ser relativamente curtos. O objetivo é derrubar as arestas para ver qual tendência ou padrão pode estar lá. Outros Métodos de Suavização (Seção 2.4) A Seção 2.4 descreve várias alternativas úteis e sofisticadas para suavizar a média móvel. Os detalhes podem parecer incompletos, mas tudo bem, porque não queremos ficar atolados em muitos detalhes para esses métodos. Dos métodos alternativos descritos na Seção 2.4, o lowess (regressão ponderada localmente) pode ser o mais amplamente utilizado. Exemplo 2 Continuação O gráfico seguinte é uma linha de tendência suavizada para a série de Desemprego dos EUA, encontrada usando um suavizador de baixa densidade, em que uma quantidade substancial (2/3) contribuiu para cada estimativa suavizada. Note que isso suavizou a série de forma mais agressiva do que a média móvel. Os comandos utilizados foram: Desemprego (desempregado, início c (1948,1), freq12) (lowess (desempregado, f 2/3), principal suavização de Lowess da Tendência de Desemprego nos EUA) Suavização exponencial simples A equação básica de previsão para suavização exponencial simples Muitas vezes, é dado como um valor de x no tempo t1 para ser uma combinação ponderada do valor observado no tempo teo valor previsto no tempo t. Embora o método seja chamado de método de suavização, é usado principalmente para previsão de curto prazo. O valor de é chamado a constante de suavização. Por alguma razão, 0.2 é uma escolha padrão de programas. Isso coloca um peso de 0,2 na observação mais recente e um peso de 1,2,3 na previsão mais recente. Com um valor relativamente pequeno, a suavização será relativamente mais extensa. Com um valor relativamente grande de, o alisamento é relativamente menos extenso à medida que mais peso será colocado no valor observado. Esse é um método simples de previsão de um passo à frente que, à primeira vista, parece não exigir um modelo para os dados. De fato, este método é equivalente ao uso de um modelo ARIMA (0,1,1) sem constante. O procedimento ideal é ajustar um modelo ARIMA (0,1,1) ao conjunto de dados observado e usar os resultados para determinar o valor de. Isso é ótimo no sentido de criar o melhor para os dados já observados. Embora o objetivo seja suavizar e antecipar um passo à frente, a equivalência ao modelo ARIMA (0,1,1) traz um bom ponto. Não devemos aplicar cegamente suavização exponencial porque o processo subjacente pode não ser bem modelado por um ARIMA (0,1,1). ARIMA (0,1,1) e Equivalência de Suavização Exponencial Considere um ARIMA (0,1,1) com média 0 para as primeiras diferenças, xt - x t - 1: begin hat amp amp xt theta1 w amp amp xteta1 (xt - que t) amp amp (1 theta1) xt - theta que tendem. Se deixarmos (1 1) e, portanto, - (1) 1, vermos a equivalência à equação (1) acima. Por que o Método é Chamado Alisamento Exponencial Isto produz o seguinte: begin hat amp amp alpha xt (1-alpha) alpha x (1-alpha) hat amp amp alpha xt alfa (1-alfa) x (1-alpha) 2que end Continue desta forma substituindo sucessivamente o valor previsto no lado direito da equação. Isso leva a: hat alfa xt alfa (1-alfa) x alfa (1-alfa) 2 x pontos alfa (1-alfa) jx pontos alfa (1-alfa) x1 texto A equação 2 mostra que o valor previsto é uma média ponderada de todos os valores passados ​​da série, com pesos exponencialmente variáveis ​​à medida que voltamos à série. Alinhamento Exponencial Ótimo em R Basicamente, apenas ajustamos um ARIMA (0,1,1) aos dados e determinamos o coeficiente. Podemos examinar o ajuste da suavidade comparando os valores previstos com a série real. A suavização exponencial tende a ser usada mais como uma ferramenta de previsão do que como um verdadeiro suavizador, portanto, procuramos ver se temos um bom ajuste. Exemplo 3 n 100 observações mensais do logaritmo de um índice de preços do petróleo nos Estados Unidos. A série de dados é: Um ajuste de ARIMA (0,1,1) em R deu um coeficiente de MA (1) 0,3877. Assim (1 1) 1,3877 e 1-0,3877. A equação de previsão de suavização exponencial é 1.3877xt - 0.3877hat t No tempo 100, o valor observado da série é x 100 0,86601. O valor previsto para a série nesse momento é Assim, a previsão para o tempo 101 é hat 1.3877x - 0.3877hat 1.3877 (0.86601) -0.3877 (0.856789) 0.8696 A seguir está o quão bem o mais suave se encaixa na série. É um bom ajuste. Isso é um bom sinal para previsão, o principal objetivo para este mais suave. Aqui estão os comandos usados ​​para gerar a saída para este exemplo: mapeamento de oilindex (oildata. dat) plot (índice de óleo, tipo b, Log principal da série de índices de petróleo) expsmoothfit arima (índice de óleo, ordem c (0,1,1)) expsmoothfit para ver os resultados estimados prevê indexe de óleo - expsmoothimagemresponíveis estimados valores de plotagem (índice de petróleo, typeb, suavização exponencial principal do registro do índice de petróleo) linhas (previsto) 1.3877oilindex100-0.3877preditos100 previsão para o tempo 101 Suavização exponencial dupla A suavização exponencial dupla pode ser usada quando houver tendência (longo prazo ou curto prazo), mas sem sazonalidade. Essencialmente, o método cria uma previsão combinando estimativas exponencialmente suavizadas da tendência (inclinação de uma linha reta) e o nível (basicamente, a interceptação de uma linha reta). Dois pesos diferentes, ou parâmetros de suavização, são usados ​​para atualizar esses dois componentes a cada vez. O nível suavizado é mais ou menos equivalente a uma simples suavização exponencial dos valores de dados e a tendência suavizada é mais ou menos equivalente a uma simples suavização exponencial das primeiras diferenças. O procedimento equivale à montagem de um modelo ARIMA (0,2,2), sem constante, pode ser realizado com um ajuste ARIMA (0,2,2). (1-B) 2 xt (1teta1B teta2B2) wt. Navegação

No comments:

Post a Comment