Sobre as ferramentas de análise estatística

O Microsoft Excel oferece um conjunto de ferramentas de análise de dados chamada Ferramentas de Análise, que você pode usar para salvar as etapas ao desenvolver análises estatísticas ou de engenharia complexas. Você fornece os dados e os parâmetros. A ferramenta usa as funções de macro estatísticas e de engenharia apropriadas e exibe os resultados em uma tabela de saída. Algumas ferramentas geram gráficos além das tabelas de saída.

Funções de planilha relacionadas O Excel oferece várias outras funções de planilha estatísticas, financeiras e de engenharia. Algumas funções estatísticas são internas e outras são disponibilizadas quando você instala as Ferramentas de Análise.

Acessando as ferramentas de análise de dados As Ferramentas de Análise incluem as ferramentas descritas a seguir. Para acessá-las, clique em Análise de Dados no menu Ferramentas. Se o comando Análise de Dados não estiver disponível, você precisará carregar o programa suplementar (suplemento: um programa suplementar que adiciona comandos ou recursos personalizados ao Microsoft Office.) das Ferramentas de Análise.

MostrarAnova

As ferramentas de análise Anova oferecem diferentes tipos de análise de variância. A ferramenta a ser utilizada depende do número de fatores e do número de amostras recebidas das populações que você deseja testar.

Anova: Fator Exclusivo Esta ferramenta executa uma simples análise da variância dos dados em duas ou mais amostras. A análise fornece um teste da hipótese de que cada amostra é obtida na mesma distribuição de probabilidade subjacente, com base na hipótese alternativa de que as distribuições de probabilidade subjacentes não são as mesmas em todas as amostras. Se houvesse duas amostras, a função de planilha, TTEST, poderia ser usada da mesma forma, sem nenhum problema. Com mais de duas amostras, não há uma generalização conveniente da função TTEST e o modelo Anova: Fator Exclusivo pode ser chamado.

Anova: Fator Dois com Replicação Esta ferramenta de análise é útil quando os dados podem ser classificados em duas dimensões diferentes. Por exemplo, em uma experiência para medir a altura das plantas, estas poderão receber diferentes marcas de fertilizante (por exemplo, A, B, C) e possivelmente também serão mantidas em temperaturas diferentes (por exemplo, baixa, alta). Para cada um dos seis pares possíveis de {fertilizante, temperatura}, teremos um número igual de observações sobre altura de plantas. Com essa ferramenta Anova, podemos testar:

  1. Se as alturas das plantas com marcas de fertilizantes diferentes são obtidas na mesma população subjacente; as temperaturas são ignoradas nesta análise.
  2. Se as alturas das plantas com níveis de temperatura diferentes são obtidas na mesma população subjacente; as marcas de fertilizante são ignoradas nesta análise.
  3. Se, considerando os efeitos das diferenças entre marcas de fertilizante encontradas na etapa 1 e diferenças entre temperaturas encontradas na etapa 2, as seis amostras que representam todos os pares de valores de {fertilizante, temperatura} são obtidos na mesma população. A hipótese alternativa é de que há efeitos decorrentes de pares específicos de {fertilizante, temperatura} que estão acima das diferenças que se baseiam somente no fertilizante ou na temperatura.

Configuração do intervalo de entrada da ferramenta Anova

Anova: Fator Dois sem Replicação Esta ferramenta de análise é útil quando os dados são classificados em duas dimensões diferentes, como no caso do Fator Dois sem Replicação. No entanto, nesta ferramenta, assumimos que há somente uma única observação para cada par (por exemplo, cada par de {fertilizante, temperatura} do exemplo anterior). Com esta ferramenta, podemos aplicar os testes nas etapas 1 e 2 do caso Anova: Fator Dois com Replicação, mas não temos dados suficientes para aplicar o teste na etapa 3.

MostrarCorrelação

As funções de planilha CORREL e PEARSON calculam o coeficiente de correlação entre duas variáveis de medida quando as medições em cada variável são observadas para cada N assuntos. (Qualquer observação ausente sobre qualquer assunto faz com que esse assunto seja ignorado na análise.) A ferramenta de análise Correlação é particularmente útil quando há mais de duas variáveis de medida para cada N assuntos. Ela fornece uma tabela de saída, ou seja, uma matriz de correlação, mostrando o valor da função CORREL (ou PEARSON) aplicada a cada par possível das variáveis de medida.

O coeficiente de correlação, como a covariância, é uma forma de medir até que ponto as variáveis de medida “se movem juntas”. Diferente da covariância, o coeficiente de correlação é escalonado de modo que seu valor seja independente das unidades em que as duas variáveis de medida são expressas. (Por exemplo, se as duas variáveis de medida forem peso e altura, o valor do coeficiente de correlação ficará inalterado caso o peso seja convertido de libras em quilogramas.) O valor de qualquer coeficiente de correlação deve estar entre -1 e +1, inclusive.

Você pode usar a ferramenta de análise de correlação para examinar cada par de variáveis de medida e determinar se as duas variáveis tendem a se mover juntas, ou seja, se os valores altos de uma variável tendem a ser associados aos valores altos da outra (correlação positiva), se os valores baixos de uma variável tendem a ser associados aos valores altos da outra (correlação negativa) ou se os valores das duas variáveis tendem a não se relacionar (correlação próxima de zero).

MostrarCovariância

As ferramentas Correlação e Covariância podem ser usadas na mesma configuração, quando você tem N variáveis de medida diferentes observadas em um conjunto de indivíduos. Essas ferramentas fornecem uma tabela de saída, ou seja, uma matriz, mostrando o coeficiente de correlação ou a covariância, respectivamente, entre cada par de variáveis de medida. A diferença é que os coeficientes de correlação são escalonados para ficarem entre -1 e +1, inclusive. As covariâncias correspondentes não são escalonadas. O coeficiente de correlação e a covariância medem até que ponto as duas variáveis “se movem juntas”.

A ferramenta Covariância calcula o valor da função de planilha COVAR para cada par de variáveis de medida. (O uso direto de COVAR no lugar da ferramenta Covariância é uma alternativa razoável quando há apenas duas variáveis de medida, ou seja, N=2.) A entrada na diagonal da tabela de saída da ferramenta Covariância, na linha i, coluna i, é a covariância da enésima variável de medida consigo mesma. Trata-se simplesmente da variância de população dessa variável, conforme calculado pela função de planilha VARP.

Você pode usar a ferramenta de covariância para examinar cada par de variáveis de medida e determinar se as duas variáveis tendem a se mover juntas, ou seja, se os valores altos de uma variável tendem a ser associados aos valores altos da outra (covariância positiva), se os valores baixos de uma variável tendem a ser associados aos valores altos da outra (covariância negativa) ou se os valores das duas variáveis tendem a não se relacionar (covariância próxima de zero).

MostrarEstatística Descritiva

A ferramenta de análise Estatística Descritiva gera um relatório de estatística invariável para os dados do intervalo de entrada, fornecendo informações sobre a tendência central e a variabilidade dos dados.

MostrarSuavização Exponencial

A ferramenta de análise Suavização Exponencial antevê um valor com base na previsão do período anterior, com ajuste para o erro dessa previsão. A ferramenta usa a constante de suavização a, a grandeza que determina a intensidade em que as previsões respondem aos erros da previsão anterior.

 Observação   Os valores de 0,2 a 0,3 são constantes de suavizações razoáveis. Esses valores indicam que a previsão atual deve ser ajustada em 20 a 30% para compensar o erro da previsão anterior. As constantes mais altas geram uma resposta mais rápida, mas podem produzir projeções erradas. As constantes mais baixas podem resultar em longas latências nos valores da previsão.

MostrarTeste F de Duas Amostras para Variâncias

A ferramenta de análise Teste F de Duas Amostras para Variâncias realiza um teste F de duas amostras para comparar duas variâncias de população.

Por exemplo, você pode usar a ferramenta de teste F em amostragens de tempo em uma competição de natação para cada uma das duas equipes. A ferramenta oferece o resultado de um teste da hipótese nula de que essas duas amostras são provenientes de distribuições com variâncias iguais, com base na alternativa de que as variâncias não são iguais nas distribuições subjacentes.

A ferramenta calcula o valor f de uma estatística F (ou proporção F). Um valor f próximo a 1 é uma evidência de que as variâncias de população subjacentes são iguais. Na tabela de saída, se f < 1, o valor “P(F <= f) unicaudal” indicará a probabilidade de um valor da estatística F ser menor que f quando as variâncias de população forem iguais e o valor “F crítico unicaudal” atribuirá o valor crítico menor que 1 no nível de significância escolhido, Alfa. Se f > 1, o valor “P(F <= f) unicaudal” indicará a probabilidade de um valor da estatística F ser maior que f quando as variâncias de população forem iguais e o valor “F crítico unicaudal” atribuirá o valor crítico maior que 1 a Alfa.

MostrarAnálise de Fourier

A ferramenta Análise de Fourier resolve problemas nos sistemas lineares e analisa dados periódicos usando o método Transformação de Fourier Rápida (FFT) para transformar os dados. Essa ferramenta também oferece suporte a transformações inversas, nas quais o inverso dos dados transformados retorna os dados originais.

Intervalos de entrada e saída na análise de Fourier

MostrarHistograma

A ferramenta de análise Histograma calcula freqüências individuais e cumulativas para um intervalo de células de dados e escaninhos de dados. Esta ferramenta gera dados para o número de ocorrências de um valor em um conjunto de dados.

Por exemplo, em uma turma de 20 alunos, você poderia determinar a distribuição de pontos em categorias de letras. Uma tabela de histograma apresenta os limites das notas em letras e o número de pontos entre o limite inferior e o limite atual. A pontuação exclusiva mais freqüente será o modo dos dados.

MostrarMédia Móvel

A ferramenta de análise Média Móvel projeta os valores do período de previsão, com base no valor médio da variável em um número específico de períodos precedentes. Uma média móvel fornece informações sobre tendência que uma simples média de todos os dados históricos mascararia. Use esta ferramenta para fazer a previsão de vendas, estoque ou outras tendências. Cada valor de previsão baseia-se na fórmula a seguir.

Fórmula para calcular médias móveis

onde:

  • N é o número de períodos anteriores a serem incluídos na média móvel
  • Aj é o valor real no momento j
  • Fj é o valor da previsão no momento j

MostrarGeração de Número Aleatório

A ferramenta de análise Geração de Número Aleatório preenche um intervalo com números aleatórios independentes obtidos em uma das várias distribuições. Você pode caracterizar assuntos em uma população com uma distribuição de probabilidade.

Por exemplo, você poderia usar uma distribuição normal para caracterizar a população de alturas dos indivíduos ou usar a distribuição Bernoulli dos dois resultados possíveis para caracterizar a população de resultados com 50% de chance.

MostrarClassificação e Porcentagem

A ferramenta de análise Classificação e Porcentagem produz uma tabela que contém a classificação ordinal e percentual de cada valor em um conjunto de dados. Você pode analisar a posição relativa dos valores em um conjunto de dados. Esta ferramenta usa as funções de planilha RANK e PERCENTRANK. A função RANK não considera valores vinculados. Se você deseja incluir os valores vinculados, use a função de planilha RANK junto com o fator de correção sugerido no arquivo de Ajuda para essa função.

MostrarRegressão

A ferramenta de análise Regressão realiza uma análise de regressão linear usando o método de "quadrados mínimos" para encaixar uma linha em um conjunto de observações. Você pode analisar como uma única variável dependente é afetada pelos valores de uma ou mais variáveis independentes.

Por exemplo, você pode analisar como o desempenho de um atleta é afetado por fatores como idade, altura e peso. Você pode distribuir partes da medição de desempenho para cada um desses três fatores, com base em um conjunto de dados de desempenho e, em seguida, usar os resultados para prever o desempenho de um novo atleta não testado.

A ferramenta Regressão usa a função de planilha LINEST.

MostrarAmostragem

A ferramenta de análise Amostragem cria a amostra de uma população tratando o intervalo de entrada como uma população. Quando a população for muito grande para ser processada ou inserida em um gráfico, use uma amostra representativa. Também é possível criar uma amostra que contenha somente valores de uma parte específica de um ciclo, caso você acredite que os dados de entrada são periódicos.

Por exemplo, se o intervalo de entrada contiver números de vendas trimestrais, a amostragem com uma taxa periódica igual a quatro inserirá valores do mesmo trimestre no intervalo de saída.

MostrarTeste t

As ferramentas de análise Test t de Duas Amostras testam a igualdade das médias de população subjacentes a cada amostra. As três ferramentas utilizam suposições diferentes: as variâncias de população são iguais, as variâncias de população não são iguais e as duas amostras representam observações antes e depois do tratamento nos mesmos assuntos.

Nas três ferramentas mencionadas anteriormente, um valor de Estatística t é calculado e mostrado como “Estatística t” nas tabelas de saída. Dependendo dos dados, esse valor t pode ser negativo ou positivo. Partindo do pressuposto de que as médias de população subjacentes são iguais, se t < 0, o valor “P(T <= t) unicaudal” dará a probabilidade de um valor Estatística t ser mais negativo que t. Se t >=0, o valor “P(T <= t) unicaudal” dará a probabilidade de um valor Estatística t ser mais positivo que t. O valor “t crítico unicaudal” dará o valor de corte para que a probabilidade de um valor Estatística t ser maior ou igual ao valor “t crítico unicaudal” seja Alfa.

O valor “P(T <= t) bicaudal” dará a probabilidade de um valor Estatística t ser maior em valor absoluto que t. O valor “P crítico bicaudal” dará o valor de corte para que a probabilidade de um valor Estatística t ser maior em valor absoluto que “P crítico bicaudal” seja Alfa.

Teste t: Duas Amostras Assumindo Variâncias Iguais Esta ferramenta de análise realiza um teste t de duas amostras do aluno. Essa forma de teste supõe que os dois conjuntos de dados são provenientes das distribuições com as mesmas variâncias. Ele é chamado de teste t homoscedástico. Você pode usá-lo para determinar se há a probabilidade de as duas amostras serem provenientes das distribuições com médias de população iguais.

Teste t: Duas Amostras Assumindo Variâncias Diferentes Esta ferramenta de análise realiza um teste t de duas amostras do aluno. Essa forma de teste supõe que os dois conjuntos de dados são provenientes das distribuições com variâncias diferentes. Ele é chamado de teste t heterocedástico. Como acontece nas variâncias iguais acima, você pode usar esse teste t para determinar se há a probabilidade de as duas amostras serem provenientes das distribuições com médias de população iguais. Use esse teste quando houver assuntos distintos nas duas amostras. Use o teste emparelhado, descrito a seguir, quando houver um único conjunto de assuntos e as duas amostras representarem medidas para cada assunto antes e após um tratamento.

A fórmula a seguir é usada para determinar o valor de estatística t.

Fórmula para calcular o valor t

A fórmula a seguir é usada para calcular os graus de liberdade, df. Como o resultado do cálculo é geralmente um número não inteiro, o valor df é arredondado para o próximo número inteiro, a fim de obter um valor crítico da tabela t. A função de planilha TTEST do Excel usa o valor df calculado sem arredondamento, já que é possível calcular o valor de TTEST com um número df não inteiro. Devido a essas abordagens diferentes na determinação dos graus de liberdade, os resultados da função TTEST e desta ferramenta de teste t serão diferentes dos apresentados no caso das variâncias diferentes.

Fórmula para aproximar os graus de liberdade

Teste t: Duas Amostras Emparelhadas para Médias Você pode usar um teste emparelhado quando houver um emparelhamento natural das observações nas amostras, como acontece quando um grupo de amostras é testado duas vezes, antes e depois de uma experiência. Esta ferramenta de análise e sua fórmula executam um teste t emparelhado do aluno para determinar se há a probabilidade de as observações obtidas antes e depois de um tratamento serem provenientes das distribuições com médias de população iguais. Essa forma de teste não supõe que as variâncias das duas populações sejam iguais.

 Observação   Entre os resultados gerados por esta ferramenta está a variância agrupada, uma medida acumulada da dispersão dos dados sobre a média, derivada da fórmula a seguir.

Fórmula para calcular a variância agrupada

MostrarTeste z

A ferramenta de análise Teste z: Duas Amostras para Médias realiza um teste z de duas amostras para médias com variâncias conhecidas. Esta ferramenta é usada para testar a hipótese nula de que não há diferença entre duas médias de população, com base nas hipóteses alternativas unilateral ou bilateral. Se as variâncias não forem conhecidas, a função de planilha ZTEST deverá ser usada.

Quando a ferramenta Teste z é usada, devemos ter a certeza de que compreendemos a saída. O valor “P(Z <= z) unicaudal” é realmente P(Z >= ABS(z)), a probabilidade de um valor z maior que 0 na mesma direção que o valor z observado quando não há diferença entre as médias de população. O valor “P(Z <= z) bicaudal” é realmente P(Z >= ABS(z) ou Z <= -ABS(z)), a probabilidade de um valor z maior que 0 em qualer direção do valor z observado quando não há diferença entre as médias de população. O resultado bicaudal é apenas o resultado unicaudal multiplicado por 2. A ferramenta Teste z também pode ser usada quando a hipótese nula for um valor específico diferente de zero para a diferença entre as duas médias de população.

Por exemplo, você pode usar este teste para determinar as diferenças entre os desempenhos de dois modelos de carro.

 
 
Aplica-se a:
Excel 2003