Suavização exponencial
Teoria da suavização exponencial
Inicialmente, eu iria escrever um artigo sobre indicadores técnicos e falaria sobre média móvel exponencial. Entretanto, ao estudar a teoria desse indicador, acabei me deparando com algumas coisas interessantes mais relacionadas a estatística do que ao mercado de ações ou forex.
Visto que as estatísticas já foram mencionadas neste site, decidi escrever um artigo separado sobre isso - o artigo sobre suavização exponencial na análise de séries temporais.
Este tópico foi levantado no artigo Flutuações sazonais. Índices sazonais. Método de médias simples. O cálculo dos índices médios de sazonalidade dos métodos comuns de médias pode ser aplicado majoritariamente a séries temporais onde não houve tendências de alta/baixa, ou são insignificantes. Em outras palavras, o valor observado flutua em torno de algum valor permanente.
O que isso significa? Isso significa que a média é constante e, por esse motivo, não consegue captar a tendência.
Vamos ilustrar isso com um gráfico
Falando de modo geral, todos os métodos de cálculo da média pretendem eliminar o "ruído" da dispersão aleatória dos dados que permite identificar a tendência de forma mais clara ou as mudanças sazonais ou cíclicas, isto é, a estrutura interna dos dados, aparentemente aleatória, e usá-los para construir o modelo, seguido de análise e previsão de valores futuros - mas, como podemos ver, o método de média simples não funciona se houver uma tendência pronunciada. Não podemos prever nada com sua ajuda.
Devemos ser capazes de receber não apenas uma média, mas séries médias. E o método mais popular (e simples) para obter essas séries é a suavização exponencial.
Ele pode ser descrito da forma a seguir - Ao fazer previsões, os valores mais novos dos valores observados recebem o maior peso em comparação com os valores mais antigos. Ao mesmo tempo, os valores mais antigos recebem pesos decrescentes exponencialmente.
Agora descrevemos a definição com fórmulas.
Tradicionalmente, denote o valor observado como , e a média suavizada como
.
Em seguida,
indefinido
e generalizado
onde, obtém o valor a partir do intervalo [0;1)
De onde vem o expositor - revela a média anterior.
e generalizado
, para t > 2
Assim, o peso antes de - é uma progressão geométrica infinitamente decrescente com o multiplicador
E quanto mais distante o S, menos é afetado pelos valores iniciais.
Vamos supor que e vamos ver como sua contribuição muda para os vários S.
Para S2, é considerado como está, mas em S3 com um coeficiente alfa de 0.5, a contribuição de y1 é de apenas 250, em S4 - 125 e assim por diante.
Simultaneamente, a escolha do coeficiente Se você brincar com o parâmetro "a" na calculadora (veja acima), é claro que quanto mais alto o valor, mais rápido a contagem regressiva realmente deixa de afetar a média suavizada e vice-versa - quanto mais baixo, por mais tempo ela retém sua influência.
Dessa forma, para pequenos , o método de obtenção de S2 possui grande influência no resultado. A atribuição
é apenas um dos métodos. Como alternativa, o valor inicial pode ser uma média simples dos primeiros valores de y, por exemplo.
No entanto, como você escolhe ? Qual índice é mais adequado para a simulação da dinâmica desta série? Não existem fórmulas matemáticas para calcular o
exato. Este indicador geralmente é escolhido por seleção ou pelo método de "tentativas e erros".
O método consiste no fato de você pegar vários valores
em seguida, entre eles, selecionar o melhor. Qual é o critério de "melhor" no nosso caso?
Esse critério é minimizar a média dos erros quadráticos. Erro - é o desvio do valor real da previsão. Para cada valor S, é elevado ao quadrado para se livrar da influência do sinal e, em seguida, calcular a média de todos os valores. Esse índice , para o qual o valor médio e o valor mínimo são os melhores de vários.
Agora, algumas palavras sobre a previsão.
O próximo valor da série é previsto diretamente da fórmula
Se for necessário obter uma previsão para um número maior de amostras, utiliza-se a técnica chamada bootstrapping. O último valor conhecido de "y" é considerado uma constante e é utilizado na fórmula recursiva.
Legenda:
Forecast - Previsão
Last - Último
Origin - Origem
Agora aplique esse conhecimento ao calcular a média suavizada para o gráfico mostrado no início deste artigo. Para tornar isso mais interessante, calculamos a média suavizada para os três valores de uma vez e, ao mesmo tempo, calculamos o erro quadrático médio.
O gráfico mostra para referência o seguinte valor previsto, ou seja, a média móvel estendida para uma contagem além dos dados reais.
Séries temporais
| ||
---|---|---|
A propósito, devo observar que o melhor valor padrão para a calculadora acima de será 0.7
Com igual a 1, a suavização se degenera em uma repetição dos penúltimos valores que, sob variação significativa, os valores vizinhos nem sempre fornecem um erro quadrático médio mínimo.
Comentários