homechevron_rightProfissionalchevron_rightEstatística

Suavização exponencial

Teoria da suavização exponencial

Inicialmente, eu iria escrever um artigo sobre indicadores técnicos e falaria sobre média móvel exponencial. Entretanto, ao estudar a teoria desse indicador, acabei me deparando com algumas coisas interessantes mais relacionadas a estatística do que ao mercado de ações ou forex.

Visto que as estatísticas já foram mencionadas neste site, decidi escrever um artigo separado sobre isso - o artigo sobre suavização exponencial na análise de séries temporais.

Este tópico foi levantado no artigo Flutuações sazonais. Índices sazonais. Método de médias simples. O cálculo dos índices médios de sazonalidade dos métodos comuns de médias pode ser aplicado majoritariamente a séries temporais onde não houve tendências de alta/baixa, ou são insignificantes. Em outras palavras, o valor observado flutua em torno de algum valor permanente.

O que isso significa? Isso significa que a média é constante e, por esse motivo, não consegue captar a tendência.
Vamos ilustrar isso com um gráfico

PLANETCALC, Média constante - gráfico

Média constante - gráfico

Média constante
O arquivo é muito grande; pode ocorrer lentidão do navegador durante o carregamento e a criação.

Séries temporais

arrow_upwardarrow_downward
Itens por página:

Falando de modo geral, todos os métodos de cálculo da média pretendem eliminar o "ruído" da dispersão aleatória dos dados que permite identificar a tendência de forma mais clara ou as mudanças sazonais ou cíclicas, isto é, a estrutura interna dos dados, aparentemente aleatória, e usá-los para construir o modelo, seguido de análise e previsão de valores futuros - mas, como podemos ver, o método de média simples não funciona se houver uma tendência pronunciada. Não podemos prever nada com sua ajuda.
Devemos ser capazes de receber não apenas uma média, mas séries médias. E o método mais popular (e simples) para obter essas séries é a suavização exponencial.

Ele pode ser descrito da forma a seguir - Ao fazer previsões, os valores mais novos dos valores observados recebem o maior peso em comparação com os valores mais antigos. Ao mesmo tempo, os valores mais antigos recebem pesos decrescentes exponencialmente.

Agora descrevemos a definição com fórmulas.
Tradicionalmente, denote o valor observado como y, e a média suavizada como S.
Em seguida,
S_1 indefinido
S_2 = y_1
S_3 = \alpha y_2 + (1-\alpha)S_2

e generalizado

S_t = \alpha y_{t-1} + (1-\alpha)S_{t-1}

onde, \alpha obtém o valor a partir do intervalo [0;1)

De onde vem o expositor - revela a média anterior.

S_t = \alpha y_{t-1} + (1-\alpha)S_{t-1} = \alpha y_{t-1} + (1-\alpha)[\alpha y_{t-2} + (1-\alpha)S_{t-2}] = \alpha y_{t-1} + (1-\alpha)[\alpha y_{t-2} + (1-\alpha)[\alpha y_{t-3} + (1-\alpha)S_{t-3}]]
S_t = \alpha y_{t-1} + \alpha(1-\alpha)y_{t-2} + \alpha(1-\alpha)^{2}y_{t-3} + (1-\alpha)^{3}S_{t-3}

e generalizado

S_t=\alpha\sum_{i=1}^{t-2}(1-\alpha)^{i-1}y_{t-i} + (1-\alpha)^{t-2}S_2, para t > 2

Assim, o peso antes de y - é uma progressão geométrica infinitamente decrescente com o multiplicador 1-\alpha
E quanto mais distante o S, menos é afetado pelos valores iniciais.

Vamos supor que y_1=1000 e vamos ver como sua contribuição muda para os vários S.

PLANETCALC, Os valores de peso mudam para suavização exponencial

Os valores de peso mudam para suavização exponencial

Dígitos após o ponto decimal: 4
valor y1
 
Os valores de peso mudam para suavização exponencial
O arquivo é muito grande; pode ocorrer lentidão do navegador durante o carregamento e a criação.

Para S2, é considerado como está, mas em S3 com um coeficiente alfa de 0.5, a contribuição de y1 é de apenas 250, em S4 - 125 e assim por diante.

Simultaneamente, a escolha do coeficiente \alpha Se você brincar com o parâmetro "a" na calculadora (veja acima), é claro que quanto mais alto o valor, mais rápido a contagem regressiva realmente deixa de afetar a média suavizada e vice-versa - quanto mais baixo, por mais tempo ela retém sua influência.

Dessa forma, para pequenos \alpha, o método de obtenção de S2 possui grande influência no resultado. A atribuição S_2=y_1 é apenas um dos métodos. Como alternativa, o valor inicial pode ser uma média simples dos primeiros valores de y, por exemplo.

No entanto, como você escolhe \alpha? Qual índice é mais adequado para a simulação da dinâmica desta série? Não existem fórmulas matemáticas para calcular o \alpha exato. Este indicador geralmente é escolhido por seleção ou pelo método de "tentativas e erros".
O método consiste no fato de você pegar vários valores
\alpha em seguida, entre eles, selecionar o melhor. Qual é o critério de "melhor" no nosso caso?

Esse critério é minimizar a média dos erros quadráticos. Erro - é o desvio do valor real da previsão. Para cada valor S, é elevado ao quadrado para se livrar da influência do sinal e, em seguida, calcular a média de todos os valores. Esse índice \alpha, para o qual o valor médio e o valor mínimo são os melhores de vários.

Agora, algumas palavras sobre a previsão.

O próximo valor da série é previsto diretamente da fórmula
S_{forecast} = \alpha y_{last} + (1-\alpha)S_{last}

Se for necessário obter uma previsão para um número maior de amostras, utiliza-se a técnica chamada bootstrapping. O último valor conhecido de "y" é considerado uma constante e é utilizado na fórmula recursiva.

S_{forecast+n} = \alpha y_{origin} + (1-\alpha)S_{forecast+n-1}

Legenda:
Forecast - Previsão
Last - Último
Origin - Origem

Agora aplique esse conhecimento ao calcular a média suavizada para o gráfico mostrado no início deste artigo. Para tornar isso mais interessante, calculamos a média suavizada para os três valores de uma vez  \ alpha e, ao mesmo tempo, calculamos o erro quadrático médio.

O gráfico mostra para referência o seguinte valor previsto, ou seja, a média móvel estendida para uma contagem além dos dados reais.

PLANETCALC, Cálculo da média da suavização exponencial

Cálculo da média da suavização exponencial

Séries temporais

arrow_upwardarrow_downward
Itens por página:

Dígitos após o ponto decimal: 2
Raiz do erro quadrático médio 1
 
Raiz do erro quadrático médio 2
 
Raiz do erro quadrático médio 3
 
Suavização Exponencial
O arquivo é muito grande; pode ocorrer lentidão do navegador durante o carregamento e a criação.

A propósito, devo observar que o melhor valor padrão para a calculadora acima de \alpha será 0.7
Com \alpha igual a 1, a suavização se degenera em uma repetição dos penúltimos valores que, sob variação significativa, os valores vizinhos nem sempre fornecem um erro quadrático médio mínimo.

URL copiado para a área de transferência
Creative Commons Attribution/Share-Alike License 3.0 (Unported) PLANETCALC, Suavização exponencial

Comentários