Suavização exponencial

Teoria da suavização exponencial

Esta página existe graças aos esforços das seguintes pessoas:

Timur

Timur

Julia Gomes

Criado: 2021-05-26 23:15:21, Ultima atualização: 2021-05-30 12:30:51
Creative Commons Attribution/Share-Alike License 3.0 (Unported)

Este conteúdo é licenciado de acordo com a Licença Creative Commons de Atribuição/CompartilhaIgual 3.0 (Unported). Isso significa que você pode redistribuir ou modificar livremente este conteúdo sob as mesmas condições de licença e precisa atribuir ao autor original colocando um hyperlink para este trabalho no seu site. Além disto, favor não modificar qualquer referência ao trabalho original (caso houver) que estiverem contidas neste conteúdo.

Inicialmente, eu iria escrever um artigo sobre indicadores técnicos e falaria sobre média móvel exponencial. Entretanto, ao estudar a teoria desse indicador, acabei me deparando com algumas coisas interessantes mais relacionadas a estatística do que ao mercado de ações ou forex.

Visto que as estatísticas já foram mencionadas neste site, decidi escrever um artigo separado sobre isso - o artigo sobre suavização exponencial na análise de séries temporais.

Este tópico foi levantado no artigo Flutuações sazonais. Índices sazonais. Método de médias simples. O cálculo dos índices médios de sazonalidade dos métodos comuns de médias pode ser aplicado majoritariamente a séries temporais onde não houve tendências de alta/baixa, ou são insignificantes. Em outras palavras, o valor observado flutua em torno de algum valor permanente.

O que isso significa? Isso significa que a média é constante e, por esse motivo, não consegue captar a tendência.
Vamos ilustrar isso com um gráfico

PLANETCALC, Média constante - gráfico

Média constante - gráfico

Média constante
O arquivo é muito grande; pode ocorrer lentidão do navegador durante o carregamento e a criação.

Séries temporais

Itens por página:

Falando de modo geral, todos os métodos de cálculo da média pretendem eliminar o "ruído" da dispersão aleatória dos dados que permite identificar a tendência de forma mais clara ou as mudanças sazonais ou cíclicas, isto é, a estrutura interna dos dados, aparentemente aleatória, e usá-los para construir o modelo, seguido de análise e previsão de valores futuros - mas, como podemos ver, o método de média simples não funciona se houver uma tendência pronunciada. Não podemos prever nada com sua ajuda.
Devemos ser capazes de receber não apenas uma média, mas séries médias. E o método mais popular (e simples) para obter essas séries é a suavização exponencial.

Ele pode ser descrito da forma a seguir - Ao fazer previsões, os valores mais novos dos valores observados recebem o maior peso em comparação com os valores mais antigos. Ao mesmo tempo, os valores mais antigos recebem pesos decrescentes exponencialmente.

Agora descrevemos a definição com fórmulas.
Tradicionalmente, denote o valor observado como y, e a média suavizada como S.
Em seguida,
S_1 indefinido
S_2 = y_1
S_3 = \alpha y_2 + (1-\alpha)S_2

e generalizado

S_t = \alpha y_{t-1} + (1-\alpha)S_{t-1}

onde, \alpha obtém o valor a partir do intervalo [0;1)

De onde vem o expositor - revela a média anterior.

S_t = \alpha y_{t-1} + (1-\alpha)S_{t-1} = \alpha y_{t-1} + (1-\alpha)[\alpha y_{t-2} + (1-\alpha)S_{t-2}] = \alpha y_{t-1} + (1-\alpha)[\alpha y_{t-2} + (1-\alpha)[\alpha y_{t-3} + (1-\alpha)S_{t-3}]]
S_t = \alpha y_{t-1} + \alpha(1-\alpha)y_{t-2} + \alpha(1-\alpha)^{2}y_{t-3} + (1-\alpha)^{3}S_{t-3}

e generalizado

S_t=\alpha\sum_{i=1}^{t-2}(1-\alpha)^{i-1}y_{t-i} + (1-\alpha)^{t-2}S_2, para t > 2

Assim, o peso antes de y - é uma progressão geométrica infinitamente decrescente com o multiplicador 1-\alpha
E quanto mais distante o S, menos é afetado pelos valores iniciais.

Vamos supor que y_1=1000 e vamos ver como sua contribuição muda para os vários S.

PLANETCALC, Os valores de peso mudam para suavização exponencial

Os valores de peso mudam para suavização exponencial

Dígitos após o ponto decimal: 4
valor y1
 
Os valores de peso mudam para suavização exponencial
O arquivo é muito grande; pode ocorrer lentidão do navegador durante o carregamento e a criação.

Para S2, é considerado como está, mas em S3 com um coeficiente alfa de 0.5, a contribuição de y1 é de apenas 250, em S4 - 125 e assim por diante.

Simultaneamente, a escolha do coeficiente \alpha Se você brincar com o parâmetro "a" na calculadora (veja acima), é claro que quanto mais alto o valor, mais rápido a contagem regressiva realmente deixa de afetar a média suavizada e vice-versa - quanto mais baixo, por mais tempo ela retém sua influência.

Dessa forma, para pequenos \alpha, o método de obtenção de S2 possui grande influência no resultado. A atribuição S_2=y_1 é apenas um dos métodos. Como alternativa, o valor inicial pode ser uma média simples dos primeiros valores de y, por exemplo.

No entanto, como você escolhe \alpha? Qual índice é mais adequado para a simulação da dinâmica desta série? Não existem fórmulas matemáticas para calcular o \alpha exato. Este indicador geralmente é escolhido por seleção ou pelo método de "tentativas e erros".
O método consiste no fato de você pegar vários valores
\alpha em seguida, entre eles, selecionar o melhor. Qual é o critério de "melhor" no nosso caso?

Esse critério é minimizar a média dos erros quadráticos. Erro - é o desvio do valor real da previsão. Para cada valor S, é elevado ao quadrado para se livrar da influência do sinal e, em seguida, calcular a média de todos os valores. Esse índice \alpha, para o qual o valor médio e o valor mínimo são os melhores de vários.

Agora, algumas palavras sobre a previsão.

O próximo valor da série é previsto diretamente da fórmula
S_{forecast} = \alpha y_{last} + (1-\alpha)S_{last}

Se for necessário obter uma previsão para um número maior de amostras, utiliza-se a técnica chamada bootstrapping. O último valor conhecido de "y" é considerado uma constante e é utilizado na fórmula recursiva.

S_{forecast+n} = \alpha y_{origin} + (1-\alpha)S_{forecast+n-1}

Legenda:
Forecast - Previsão
Last - Último
Origin - Origem

Agora aplique esse conhecimento ao calcular a média suavizada para o gráfico mostrado no início deste artigo. Para tornar isso mais interessante, calculamos a média suavizada para os três valores de uma vez  \ alpha e, ao mesmo tempo, calculamos o erro quadrático médio.

O gráfico mostra para referência o seguinte valor previsto, ou seja, a média móvel estendida para uma contagem além dos dados reais.

PLANETCALC, Cálculo da média da suavização exponencial

Cálculo da média da suavização exponencial

Séries temporais

Itens por página:

Dígitos após o ponto decimal: 2
Raiz do erro quadrático médio 1
 
Raiz do erro quadrático médio 2
 
Raiz do erro quadrático médio 3
 
Suavização Exponencial
O arquivo é muito grande; pode ocorrer lentidão do navegador durante o carregamento e a criação.

A propósito, devo observar que o melhor valor padrão para a calculadora acima de \alpha será 0.7
Com \alpha igual a 1, a suavização se degenera em uma repetição dos penúltimos valores que, sob variação significativa, os valores vizinhos nem sempre fornecem um erro quadrático médio mínimo.

URL copiado para a área de transferência
PLANETCALC, Suavização exponencial

Comentários