Sunday 24 December 2017

Smoothing moving average excel


Moving Average Este exemplo ensina como calcular a média móvel de uma série de tempo no Excel. Um avanço em movimento é usado para suavizar irregularidades (picos e vales) para reconhecer facilmente as tendências. 1. Primeiro, vamos dar uma olhada em nossa série de tempo. 2. No separador Dados, clique em Análise de dados. Observação: não é possível encontrar o botão Análise de dados Clique aqui para carregar o suplemento do Analysis ToolPak. 3. Selecione Média móvel e clique em OK. 4. Clique na caixa Input Range e selecione o intervalo B2: M2. 5. Clique na caixa Intervalo e escreva 6. 6. Clique na caixa Output Range e seleccione a célula B3. 8. Faça um gráfico destes valores. Explicação: porque definimos o intervalo como 6, a média móvel é a média dos 5 pontos de dados anteriores eo ponto de dados atual. Como resultado, os picos e vales são suavizados. O gráfico mostra uma tendência crescente. O Excel não consegue calcular a média móvel para os primeiros 5 pontos de dados porque não existem pontos de dados anteriores suficientes. 9. Repita os passos 2 a 8 para intervalo 2 e intervalo 4. Conclusão: Quanto maior o intervalo, mais os picos e vales são suavizados. Quanto menor o intervalo, mais próximas as médias móveis são para os pontos de dados reais. Você gosta deste site gratuito Por favor, compartilhe esta página no GoogleForecasting por Smoothing Techniques Este site faz parte dos objetos de aprendizagem JavaScript E-Labs para tomada de decisão. Outros JavaScript nesta série são classificados em diferentes áreas de aplicações na seção MENU nesta página. Uma série de tempo é uma seqüência de observações que são ordenadas no tempo. Inerente na coleta de dados levados ao longo do tempo é alguma forma de variação aleatória. Existem métodos para reduzir o cancelamento do efeito devido a variação aleatória. As técnicas amplamente utilizadas são suavização. Estas técnicas, quando devidamente aplicadas, revelam mais claramente as tendências subjacentes. Insira a série de tempo em ordem de linha em seqüência, começando pelo canto superior esquerdo e o (s) parâmetro (s) e, em seguida, clique no botão Calcular para obter uma previsão de um período antecipado. Caixas em branco não são incluídas nos cálculos, mas zeros são. Ao inserir seus dados para mover de célula para célula na matriz de dados use a tecla Tab não seta ou digite chaves. Características de séries temporais, que podem ser reveladas ao examinar seu gráfico. Com os valores previstos, eo comportamento residual, modelagem de previsão de condições. Médias móveis: As médias móveis classificam-se entre as técnicas mais populares para o pré-processamento de séries temporais. Eles são usados ​​para filtrar o ruído branco aleatório dos dados, para tornar a série de tempo mais suave ou mesmo para enfatizar certos componentes informativos contidos na série de tempo. Suavização Exponencial: Este é um esquema muito popular para produzir uma Série de Tempo suavizada. Enquanto que em Médias Móveis as observações passadas são ponderadas igualmente, a Suavização Exponencial atribui pesos exponencialmente decrescentes à medida que a observação avança. Em outras palavras, observações recentes recebem relativamente mais peso na previsão do que as observações mais antigas. O Double Exponential Smoothing é melhor para lidar com as tendências. Triple Exponential Smoothing é melhor no manuseio de tendências de parabola. Uma média móvel exponencialmente ponderada com uma constante de suavização a. Corresponde aproximadamente a uma média móvel simples de comprimento (isto é, período) n, onde a e n estão relacionados por: a 2 / (n1) OR n (2 - a) / a. Assim, por exemplo, uma média móvel exponencialmente ponderada com uma constante de suavização igual a 0,1 corresponderia aproximadamente a uma média móvel de 19 dias. E uma média móvel simples de 40 dias corresponderia aproximadamente a uma média móvel exponencialmente ponderada com uma constante de suavização igual a 0,04878. Suavização Linear Exponencial de Holts: Suponha que a série de tempo não é sazonal, mas exibe tendência. Holts método estima tanto o nível atual ea tendência atual. Observe que a média móvel simples é caso especial da suavização exponencial, definindo o período da média móvel para a parte inteira de (2-Alpha) / Alpha. Para a maioria dos dados empresariais, um parâmetro Alpha menor que 0,40 é frequentemente eficaz. No entanto, pode-se realizar uma busca de grade do espaço de parâmetro, com 0,1 a 0,9, com incrementos de 0,1. Então o melhor alfa tem o menor erro médio absoluto (erro MA). Como comparar vários métodos de alisamento: Embora existam indicadores numéricos para avaliar a precisão da técnica de previsão, a abordagem mais ampla consiste na comparação visual de várias previsões para avaliar a sua precisão e escolher entre os vários métodos de previsão. Nesta abordagem, é necessário plotar (usando, por exemplo, Excel) no mesmo gráfico os valores originais de uma variável de série temporal e os valores previstos de vários métodos de previsão diferentes, facilitando assim uma comparação visual. Você pode gostar de usar as Previsões Passadas por Técnicas de Suavização JavaScript para obter os valores de previsão anteriores com base em técnicas de suavização que usam apenas um único parâmetro. Holt e Winters usam dois e três parâmetros, respectivamente, portanto, não é uma tarefa fácil selecionar os valores ótimos, ou mesmo próximos, ótimos por tentativa e erros para os parâmetros. A suavização exponencial única enfatiza a perspectiva de curto alcance que define o nível para a última observação e é baseada na condição de que não há tendência. A regressão linear, que se ajusta a uma linha de mínimos quadrados aos dados históricos (ou dados históricos transformados), representa a faixa de longo alcance, que está condicionada à tendência básica. Holts linear suavização exponencial captura informações sobre tendência recente. Os parâmetros no modelo de Holts são níveis-parâmetro que devem ser diminuídos quando a quantidade de variação de dados é grande, e as tendências-parâmetro devem ser aumentadas se a tendência de direção recente é apoiada pelo causal alguns fatores. Previsão de Curto Prazo: Observe que cada JavaScript nesta página fornece uma previsão de um passo adiante. Para obter uma previsão de duas etapas. Basta adicionar o valor previsto ao final dos dados de séries temporais e, em seguida, clicar no mesmo botão Calcular. Você pode repetir este processo por algumas vezes para obter as previsões de curto prazo necessárias. Dados de suavização remove variação aleatória e mostra tendências e componentes cíclicos Inerente na coleta de dados levados ao longo do tempo é alguma forma de variação aleatória. Existem métodos para reduzir o cancelamento do efeito devido a variação aleatória. Uma técnica freqüentemente usada na indústria é suavizar. Essa técnica, quando corretamente aplicada, revela mais claramente a tendência subjacente, os componentes sazonais e cíclicos. Existem dois grupos distintos de métodos de alisamento Métodos de média Métodos de suavização exponencial Tomar médias é a maneira mais simples de suavizar os dados Vamos primeiro investigar alguns métodos de média, como a média simples de todos os dados passados. Um gerente de um armazém quer saber o quanto um fornecedor típico oferece em unidades de 1000 dólares. Ele / ela toma uma amostra de 12 fornecedores, aleatoriamente, obtendo os seguintes resultados: A média computada ou média dos dados 10. O gerente decide usar isto como a estimativa para despesa de um fornecedor típico. Esta é uma boa ou má estimativa O erro quadrático médio é uma forma de julgar o quão bom é um modelo Vamos calcular o erro quadrático médio. O valor verdadeiro do erro gasto menos o valor estimado. O erro ao quadrado é o erro acima, ao quadrado. O SSE é a soma dos erros quadrados. O MSE é a média dos erros quadrados. Resultados do MSE por exemplo Os resultados são: Erro e esquadrado Erros A estimativa 10 A questão surge: podemos usar a média para prever a renda se suspeitarmos de uma tendência? Um olhar para o gráfico abaixo mostra claramente que não devemos fazer isso. A média pondera todas as observações passadas igualmente Em resumo, afirmamos que A média simples ou média de todas as observações passadas é apenas uma estimativa útil para previsão quando não há tendências. Se houver tendências, use estimativas diferentes que levem em conta a tendência. A média pesa todas as observações passadas igualmente. Por exemplo, a média dos valores 3, 4, 5 é 4. Sabemos, é claro, que uma média é calculada adicionando todos os valores e dividindo a soma pelo número de valores. Outra forma de calcular a média é adicionando cada valor dividido pelo número de valores, ou 3/3 4/3 5/3 1 1.3333 1.6667 4. O multiplicador 1/3 é chamado de peso. Em geral: barra fração soma esquerda (fratura direita) x1 esquerda (fratura direita) x2,. ,, Esquerda (frac direito) xn. O (esquerda (frac direito)) são os pesos e, naturalmente, eles somam a 1.Exponential Smoothing Explicado. Cópia Copyright. O conteúdo do InventoryOps está protegido por direitos de autor e não está disponível para republicação. Quando as pessoas encontram pela primeira vez o termo suavização exponencial, eles podem pensar que soa como um inferno de um monte de suavização. Seja qual for a suavização. Eles então começam a imaginar um cálculo matemático complicado que provavelmente requer um grau em matemática para entender, e espero que haja uma função embutida do Excel disponível se eles precisam fazer isso. A realidade da suavização exponencial é muito menos dramática e muito menos traumática. A verdade é, suavização exponencial é um cálculo muito simples que realiza uma tarefa bastante simples. Ele só tem um nome complicado, porque o que tecnicamente acontece como resultado deste cálculo simples é realmente um pouco complicado. Para entender a suavização exponencial, ajuda a começar com o conceito geral de suavização e um par de outros métodos comuns usados ​​para obter suavização. O que é alisamento A suavização é um processo estatístico muito comum. Na verdade, encontramos regularmente dados alisados ​​em várias formas em nossas vidas diárias. Toda vez que você usar uma média para descrever algo, você está usando um número suavizado. Se você pensar sobre por que você usa uma média para descrever algo, você vai rapidamente entender o conceito de suavização. Por exemplo, nós apenas experimentamos o inverno mais quente registrado. Como somos capazes de quantificar este Bem, começamos com conjuntos de dados das temperaturas altas e baixas diárias para o período que chamamos de Inverno para cada ano na história registrada. Mas isso nos deixa com um monte de números que saltam um pouco (não é como todos os dias este inverno foi mais quente do que os dias correspondentes de todos os anos anteriores). Precisamos de um número que elimine tudo isso pulando em torno dos dados para que possamos mais facilmente comparar um inverno para o próximo. Removendo o salto em torno dos dados é chamado de suavização, e neste caso, podemos apenas usar uma média simples para realizar a suavização. Na previsão de demanda, usamos suavização para remover a variação aleatória (ruído) de nossa demanda histórica. Isso nos permite identificar melhor os padrões de demanda (principalmente tendência e sazonalidade) e os níveis de demanda que podem ser usados ​​para estimar a demanda futura. O ruído na demanda é o mesmo conceito que o saltar diário dos dados da temperatura. Não é de surpreender que a forma mais comum de as pessoas removerem o ruído da história de demanda seja usar um simples medidor ou mais especificamente uma média móvel. Uma média móvel apenas usa um número predefinido de períodos para calcular a média, e esses períodos se movem com o passar do tempo. Por exemplo, se eu estou usando uma média móvel de 4 meses, e hoje é 01 de maio, estou usando uma média de demanda que ocorreu em janeiro, fevereiro, março e abril. No dia 1º de junho, estarei usando a demanda de fevereiro, março, abril e maio. Média móvel ponderada. Ao usar uma média, estamos aplicando a mesma importância (peso) a cada valor no conjunto de dados. Na média móvel de 4 meses, cada mês representava 25 da média móvel. Ao usar o histórico de demanda para projetar a demanda futura (e especialmente a tendência futura), é lógico chegar à conclusão de que você gostaria que a história mais recente tivesse um impacto maior em sua previsão. Podemos adaptar nosso cálculo da média móvel para aplicar vários pesos a cada período para obter os resultados desejados. Nós expressamos esses pesos como porcentagens eo total de todos os pesos para todos os períodos deve somar 100. Portanto, se decidimos que queremos aplicar 35 como o peso para o período mais próximo em nossa média móvel ponderada de 4 meses, podemos Subtrair 35 de 100 para achar que temos 65 restantes para dividir sobre os outros 3 períodos. Por exemplo, podemos terminar com uma ponderação de 15, 20, 30 e 35, respectivamente, para os 4 meses (15 20 30 35 100). Suavização exponencial. Se voltarmos ao conceito de aplicar um peso ao período mais recente (como 35 no exemplo anterior) e espalhar o peso restante (calculado subtraindo o peso do período mais recente de 35 de 100 para obter 65), temos Os blocos de construção básicos para o nosso cálculo de suavização exponencial. A entrada de controle do cálculo de suavização exponencial é conhecida como o fator de suavização (também chamado de constante de suavização). Representa essencialmente a ponderação aplicada aos períodos mais recentes de procura. Então, onde usamos 35 como ponderação para o período mais recente no cálculo da média móvel ponderada, também poderíamos escolher usar 35 como o fator de suavização em nosso cálculo de suavização exponencial para obter um efeito semelhante. A diferença com o cálculo de suavização exponencial é que, em vez de ter que também descobrir quanto peso a aplicar a cada período anterior, o fator de suavização é usado para fazer isso automaticamente. Então aqui vem a parte exponencial. Se usarmos 35 como fator de suavização, a ponderação dos períodos mais recentes exigirá 35. A ponderação dos próximos períodos mais recentes demanda (o período anterior ao mais recente) será de 65 de 35 (65 vem de subtrair 35 de 100). Isso equivale a 22,75 ponderação para esse período, se você fizer a matemática. Os próximos períodos mais recentes demanda será de 65 de 65 de 35, o que equivale a 14,79. O período antes disso será ponderado como 65 de 65 de 65 de 35, o que equivale a 9,61, e assim por diante. E isso vai de volta através de todos os seus períodos anteriores todo o caminho de volta para o início do tempo (ou o ponto em que você começou a usar suavização exponencial para esse item em particular). Você provavelmente está pensando que está olhando como um monte de matemática. Mas a beleza do cálculo de suavização exponencial é que, em vez de ter que recalcular cada período anterior cada vez que você obtiver uma nova demanda de períodos, basta usar a saída do cálculo de suavização exponencial do período anterior para representar todos os períodos anteriores. Você está confuso ainda Isso fará mais sentido quando olharmos para o cálculo real Normalmente nos referimos à saída do cálculo de suavização exponencial como a próxima previsão de período. Na realidade, a previsão final precisa de um pouco mais de trabalho, mas para os propósitos deste cálculo específico, vamos nos referir a ele como a previsão. O cálculo de suavização exponencial é o seguinte: Os períodos mais recentes exigidos multiplicados pelo fator de suavização. PLUS Previsão dos períodos mais recentes multiplicada por (um menos o factor de suavização). D os períodos mais recentes exigem S o fator de suavização representado em forma decimal (então 35 seria representado como 0,35). F os períodos mais recentes previstos (a saída do cálculo de suavização do período anterior). OR (assumindo um fator de suavização de 0,35) (D 0,35) (F 0,65) Não é muito mais simples do que isso. Como você pode ver, tudo o que precisamos para entradas de dados aqui são os períodos mais recentes de demanda e os períodos mais recentes previstos. Aplicamos o fator de suavização (ponderação) aos períodos mais recentes, exigindo da mesma forma que o faria no cálculo da média móvel ponderada. Aplicamos então a ponderação restante (1 menos o factor de alisamento) aos períodos mais recentes previstos. Uma vez que a previsão de períodos mais recente foi criada com base na demanda de períodos anteriores e nos períodos anteriores, que se baseou na demanda do período anterior e na previsão do período anterior, baseada na demanda do período anterior E a previsão para o período anterior, que se baseou no período anterior. Bem, você pode ver como todos os períodos anteriores demanda são representados no cálculo sem realmente voltar e recalcular qualquer coisa. E isso é o que levou a popularidade inicial de suavização exponencial. Não era porque fêz um trabalho melhor de suavização do que a média móvel ponderada, era porque era mais fácil de calcular em um programa de computador. E, porque você não precisa pensar sobre o que ponderar para dar períodos anteriores ou quantos períodos anteriores para usar, como você faria na média móvel ponderada. E, porque soava mais frio do que a média móvel ponderada. De fato, pode-se argumentar que a média móvel ponderada proporciona maior flexibilidade, uma vez que você tem mais controle sobre a ponderação dos períodos anteriores. A realidade é que qualquer um destes pode fornecer resultados respeitáveis, então por que não ir com soar mais fácil e mais fresco. Suavização exponencial no Excel Permite ver como isso seria realmente olhar em uma planilha com dados reais. Cópia Copyright. O conteúdo do InventoryOps está protegido por direitos de autor e não está disponível para republicação. Na Figura 1A, temos uma planilha Excel com 11 semanas de demanda, e uma previsão exponencialmente suavizada calculada a partir dessa demanda. Eu usei um fator de suavização de 25 (0,25 na célula C1). A célula ativa atual é Cell M4 que contém a previsão para semana 12. Você pode ver na fórmula barra, a fórmula é (L3C1) (L4 (1-C1)). Portanto, as únicas entradas diretas para este cálculo são a demanda de períodos anteriores (célula L3), os períodos prévios previstos (célula L4) e o fator de suavização (célula C1, mostrada como referência de célula absoluta C1). Quando começamos um cálculo de suavização exponencial, precisamos conectar manualmente o valor para a 1ª previsão. Assim, na célula B4, em vez de uma fórmula, acabamos de digitar a demanda do mesmo período da previsão. Na Célula C4 temos o nosso primeiro cálculo exponencial de suavização (B3C1) (B4 (1-C1)). Podemos então copiar Célula C4 e colá-lo em Células D4 a M4 para preencher o resto de nossas células de previsão. Agora você pode clicar duas vezes em qualquer célula de previsão para ver que é baseado na célula de previsão de períodos anteriores e na célula de demanda de períodos anteriores. Assim, cada subsequente cálculo de suavização exponencial herda a saída do cálculo de suavização exponencial anterior. É assim que cada demanda de períodos anteriores é representada no cálculo dos períodos mais recentes, mesmo que esse cálculo não faça referência direta a esses períodos anteriores. Se você quiser obter fantasia, você pode usar Excels trace antecedentes função. Para fazer isso, clique em Célula M4 e, em seguida, na barra de ferramentas da faixa de opções (Excel 2007 ou 2018), clique na guia Fórmulas e, em seguida, clique em Rastrear precedentes. Ele irá desenhar linhas de conector para o primeiro nível de precedentes, mas se você continuar clicando em Trace Precedents, desenhará linhas de conector para todos os períodos anteriores para mostrar os relacionamentos herdados. Agora vamos ver o que suavização exponencial fez por nós. A Figura 1B mostra um gráfico linear de nossa demanda e previsão. Você caso ver como a previsão exponencial suavizada remove a maior parte do jaggedness (o saltar ao redor) da demanda semanal, mas ainda consegue seguir o que parece ser uma tendência ascendente na demanda. Você também notará que a linha de previsão suavizada tende a ser menor do que a linha de demanda. Isso é conhecido como atraso de tendência e é um efeito colateral do processo de suavização. Toda vez que você usar suavização quando uma tendência está presente sua previsão ficará atrás da tendência. Isto é verdade para qualquer técnica de suavização. De fato, se continuássemos esta planilha e começássemos a inserir números de demanda mais baixos (fazendo uma tendência descendente), veríamos a queda da linha de demanda ea linha de tendência se mover acima dela antes de começar a seguir a tendência descendente. É por isso que eu mencionei anteriormente a saída do cálculo exponencial suavização que chamamos de uma previsão, ainda precisa de algum trabalho mais. Há muito mais a previsão do que apenas alisar as colisões na demanda. Precisamos fazer ajustes adicionais para coisas como defasagem de tendência, sazonalidade, eventos conhecidos que podem afetar a demanda, etc. Mas tudo isso está além do escopo deste artigo. Provavelmente, você também corre em termos como suavização exponencial dupla e suavização tripla exponencial. Esses termos são um pouco enganador, uma vez que você não está re-suavização da demanda várias vezes (você poderia se você quiser, mas isso não é o ponto aqui). Estes termos representam o uso de suavização exponencial em elementos adicionais da previsão. Assim, com a suavização exponencial simples, você está suavizando a demanda básica, mas com a suavização exponencial dupla você está suavizando a demanda base mais a tendência e, com a suavização exponencial tripla, está alisando a demanda básica mais a tendência mais a sazonalidade. A outra pergunta mais comumente questionada sobre a suavização exponencial é onde faço para obter o meu fator de suavização Não há nenhuma resposta mágica aqui, você precisa testar vários fatores de suavização com seus dados de demanda para ver o que você recebe os melhores resultados. Existem cálculos que podem definir automaticamente (e alterar) o fator de suavização. Estes se enquadram no termo alisamento adaptativo, mas você precisa ter cuidado com eles. Simplesmente não há uma resposta perfeita e você não deve cegamente implementar qualquer cálculo sem testes minuciosos e desenvolver uma compreensão completa do que esse cálculo faz. Você também deve executar cenários de ocorrência para ver como esses cálculos reagem às mudanças de demanda que talvez não existam atualmente nos dados de demanda que você está usando para testes. O exemplo de dados que eu usei anteriormente é um bom exemplo de uma situação em que você realmente precisa testar alguns outros cenários. Esse exemplo de dados particulares mostra uma tendência ascendente um tanto consistente. Muitas grandes empresas com software de previsão muito caro entrou em grande problema no passado não tão distante quando suas configurações de software que foram ajustadas para uma economia em crescimento não reagiram bem quando a economia começou a estagnar ou encolher. Coisas como esta acontecem quando você não entende o que seus cálculos (software) está realmente fazendo. Se eles entendessem seu sistema de previsão, eles teriam sabido que precisavam pular e mudar algo quando havia mudanças súbitas e dramáticas em seus negócios. Então, você tem o básico de suavização exponencial explicado. Quer saber mais sobre o uso de suavização exponencial em uma previsão real, confira o meu livro Inventory Management Explained. Cópia Copyright. O conteúdo do InventoryOps está protegido por direitos de autor e não está disponível para republicação. Dave Piasecki. É proprietário / operador da Inventory Operations Consulting LLC. Uma empresa de consultoria que presta serviços relacionados à gestão de inventário, manuseio de materiais e operações de armazém. Tem mais de 25 anos de experiência na gestão de operações e pode ser alcançado através de seu website (inventoryops), onde mantém informações adicionais relevantes. Meu BusinessData Suavização em Excel Os estatísticos normalmente têm de olhar para grandes massas de dados e encontrar difíceis de ver padrões. Às vezes, uma tendência geral sugere uma determinada ferramenta analítica. E às vezes essa ferramenta, embora estatisticamente poderosa, não ajuda o estatístico a chegar a uma explicação. A figura a seguir é um gráfico de home runs batido na Liga Americana de 1901 até 2008. A tendência geral óbvia é que, como os anos passam, mais home runs são atingidos. Montar uma linha de regressão confirma essa idéia. A equação Home Runs 24.325Year 8211 465395 é um ótimo ajuste para os dados. A equação dá um valor R-quadrado de 0,91, indicando que um modelo linear descreve bem a relação entre home runs e anos. Apenas ajustando uma linha de regressão glosa sobre coisas importantes dentro do baseball 8212 coisas grandes e pequenas que compõem uma estação de beisebol, uma era, uma história. E o beisebol tem muitas dessas coisas. O objetivo é levá-los a revelar-se. O outro extremo da linha de regressão é conectar os pontos. Isso daria apenas um monte de ziguezagues que, provavelmente, iluminariam um século de história. O problema é como resumir sem eliminar muito: se livrar dos ziguezagues, mas manter os picos e vales importantes. Como fazer isso sem saber o que é importante com antecedência A análise exploratória de dados (EDA) ajuda a apontar o caminho. Uma técnica EDA é chamada de alisamento de três medianas. Para cada ponto de dados de uma série, substitua esse ponto de dados pela mediana de três números: o próprio ponto de dados, o ponto de dados que o precede e o ponto de dados a seguir. Por que a mediana Ao contrário da média, a mediana não é sensível a valores extremos que ocorrem de vez em quando 8212 como um zig ou um zag. O efeito é filtrar o ruído e deixar altos e baixos significativos. Por que três números Como a maioria das coisas na EDA, que não é ironclad. Para alguns conjuntos de dados, você pode querer que a mediana cubra mais números. É até as intuições, experiências e idéias do analista. Outra técnica, hanning, é uma média ponderada de corrida. Você substitui um ponto de dados pela soma de um quarto do ponto de dados anterior mais a metade do ponto de dados mais um quarto do próximo ponto de dados. Ainda outra técnica é o salto médio. Na EDA, você só precisa usar uma técnica em um conjunto de dados. Muitas vezes, você começa com uma mediana lisa, repeti-la várias vezes e, em seguida, tente um ou dois outros. Para os dados no diagrama de dispersão, aplique o três-mediano liso, repita-o (isto é, aplique-o aos dados recentemente alisados), tenha os dados suavizados e aplique a média de salto. Novamente, nenhuma técnica (ou ordem de técnicas) é certa ou errada. Você aplica o que você acha que ilumina características significativas dos dados. A seguir é parte de uma planilha para tudo isso. A coluna A mostra o ano ea coluna B mostra o número de home runs que bateu naquele ano na Liga Americana. As colunas restantes mostram sucessivas suavidades dos dados. A Coluna C aplica a lisa de três medianas à Coluna B ea Coluna D aplica a lisa de três medianas à Coluna C. Um rápido exame nos números mostra que a repetição não fez muita diferença. A Coluna E aplica-se à coluna D e a Coluna F aplica a média de salto à Coluna E. Nas Colunas C a F, o número real de home runs é usado para o primeiro valor (para o ano 1901) e para o valor final (para O ano de 2008). Você pode facilmente observar o efeito de cada técnica de suavização sucessiva na linha suavizada. A chave é clicar com o botão direito do mouse na área de plotagem e selecionar Selecionar dados no menu pop-up. Clique no nome da série de dados que representa a linha suavizada, edite o intervalo de células da série para refletir a coluna que contém a técnica de suavização específica e clique em OK para fechar as caixas de diálogo de edição. E agora a história começa a revelar-se. Em vez de uma linha de regressão que apenas lhe diz que home runs aumentam com o passar dos anos, os altos e baixos estimulam a pensar em como eles estão lá. Here8217s uma versão altamente abreviada da história do basebol consistente com as torções e as voltas da linha alisada. O segmento plano baixo de 1901 a 1920 significa a era 8220dead-ball, 8221 uma época em que a composição de uma bola de beisebol inibiu bolas batidas de ir longe o suficiente para se tornar home runs. Explorar e visualizar os dados estimula o pensamento sobre o que produz os padrões que a exploração descobre. A especulação leva a hipóteses testáveis, que levam à análise.

No comments:

Post a Comment