Acerca de las herramientas de análisis estadístico

Microsoft Excel proporciona un conjunto de herramientas de análisis de datos, denominadas Herramientas para análisis, que puede utilizar para ahorrar pasos a la hora de desarrollar análisis complejo de ingeniería o estadístico. Usted proporciona los datos y los parámetros para cada análisis; la herramienta utiliza las funciones de macros de ingeniería o estadísticas apropiadas y, a continuación, muestra los resultados en una tabla. Algunas herramientas generan gráficos además de las tablas de resultados.

Funciones relacionadas de la hoja de cálculo Excel proporciona muchas otras funciones estadísticas, financieras y de ingeniería de la hoja de cálculo. Algunas de las funciones estadísticas están integradas y otras están disponibles cuando se instalan las Herramientas para análisis.

Acceso a las herramientas de análisis de datos Las Herramientas para análisis incluyen las herramientas que se describen más abajo. Para tener acceso a estas herramientas, haga clic en Análisis de datos en el menú Herramientas. Si el comando Análisis de datos no está disponible, es necesario cargar el complemento (complemento: programa suplementario que agrega funciones o comandos personalizados a Microsoft Office.) Herramientas para análisis.

MostrarVarianza

Las herramientas de análisis de varianza proporcionan distintos tipos de análisis de la varianza. La herramienta que debe usar depende del número de factores y del número de muestras que tenga de las poblaciones que desee comprobar.

Varianza de un factor Esta herramienta realiza un análisis simple de varianza en los datos de dos o más muestras. El análisis proporciona una prueba de la hipótesis de que cada muestra se extrae de la misma distribución subyacente de probabilidades frente a la hipótesis alternativa de que las distribuciones subyacentes de probabilidades no son las mismas para todas las muestras. Si sólo existen dos muestras, puede utilizar la función para hojas de cálculo PRUEBA.T. Con más de dos muestras, PRUEBA.T no es de uso generalizado y en su lugar se puede llamar al modelo Varianza de un factor.

Varianza de dos factores con varias muestras por grupo Esta herramienta de análisis es útil cuando los datos se pueden clasificar de acuerdo con dos dimensiones diferentes. Por ejemplo, en un experimento para medir el alto de las plantas, las plantas pueden recibir diferentes marcas de fertilizante (por ejemplo, A, B o C) y también estar a temperaturas distintas (por ejemplo, alta o baja). Para cada uno de los seis pares {fertilizante, temperatura} posibles, tenemos un número igual de observaciones de alto de la planta. Con esta herramienta podemos comprobar:

  1. Si el alto de las plantas para las diferentes marcas de fertilizante se extrae de la misma población subyacente. Las temperaturas no se tienen en cuenta en este análisis.
  2. Si el alto de las plantas para los diferentes niveles de temperatura se extrae de la misma población subyacente. Las marcas de fertilizante no se tienen en cuenta en este análisis.
  3. Si habiendo tenido en cuenta los efectos de las diferentes marcas de fertilizante del primer punto con viñeta y las diferencias de temperatura del segundo punto con viñeta, las seis muestras que representan todos los pares de valores {fertilizante, temperatura} se extraen de la misma población. La hipótesis alternativa es que se produzcan efectos debidos a pares {fertilizante, temperatura} específicos más allá de las diferencias basadas sólo en el fertilizante o sólo en la temperatura.

Configuración del rango de entrada para la herramienta Varianza

Varianza de dos factores con una sola muestra por grupo Esta herramienta de análisis es útil cuando los datos se clasifican en dos dimensiones diferentes, como en el caso de la varianza de dos factores con varias muestras por grupo. No obstante, con esta herramienta se supone que existe una única observación para cada par, por ejemplo, cada uno de los pares {fertilizante, temperatura} del ejemplo anterior. Si utilizamos esta herramienta, podemos aplicar las pruebas de los puntos primero y segundo con viñeta del caso Varianza de dos factores con varias muestras por grupo, pero no disponemos de datos suficientes para aplicar la prueba del punto tercero con viñeta.

MostrarCorrelación

Las funciones COEF.DE.CORREL y PEARSON de la hoja de cálculo calculan el coeficiente de correlación entre dos variables de medida cuando se observan medidas de cada variable para cada uno de los N sujetos. (Cualquier observación que falte de cualquier sujeto hará que dicho sujeto se omita en el análisis). La herramienta de análisis Correlación es especialmente útil cuando existen más de dos variables de medida para cada uno de los N sujetos. Proporciona una tabla de resultados, una matriz de correlación que muestra el valor de COEF.DE.CORREL (o PEARSON) aplicado a cada uno de los pares de variables de medida posibles.

Tanto el coeficiente de correlación como la covarianza son medidas del grado en el que dos variables de medida "varían juntas". A diferencia de la covarianza, el coeficiente de correlación se escala para que su valor sea independiente de las unidades en las que se expresen las dos variables de medida. Por ejemplo, si las dos variables de medida son peso y alto, el valor del coeficiente de correlación no cambia si el peso se convierte de libras a kilos. El valor de cualquier coeficiente de correlación debe encontrarse entre -1 y +1, ambos inclusive.

Puede utilizar la herramienta de análisis de correlación para examinar cada par de variables de medida a fin de determinar si las dos variables de medida tienden a variar conjuntamente, es decir, si los valores altos de una variable tienden a estar asociados con los valores altos de la otra (correlación positiva), si los valores bajos de una variable tienden a estar asociados con los valores bajos de la otra (correlación negativa) o si los valores de ambas variables tienden a no estar relacionados (correlación con tendencia a 0 (cero)).

MostrarCovarianza

Las herramientas Correlación y Covarianza pueden utilizarse con la misma configuración cuando se han observado N variables de medida diferentes en un grupo de individuos. Cada una de las herramientas Correlación y Covarianza proporciona una tabla de resultados, una matriz que muestra el coeficiente de correlación o la covarianza, respectivamente, entre cada par de variables de medida. La diferencia es que los coeficientes de correlación están comprendidos entre -1 y +1, ambos inclusive. Las covarianzas correspondientes no se escalan. Tanto el coeficiente de correlación como la covarianza son medidas del grado en el que dos variables “varían juntas”.

La herramienta Covarianza calcula el valor de la función COVAR de la hoja de cálculo para cada uno de los pares de variables de medida. (Usar COVAR directamente en lugar de la herramienta Covarianza es una alternativa razonable cuando sólo hay dos variables de medida, es decir, N=2). La entrada de la diagonal de la tabla de resultados de la herramienta Covarianza en la fila i, columna i es la covarianza de la variable de medida i consigo misma. Se trata de la varianza de la población para dicha variable calculada mediante la función VARP de la hoja de cálculo.

Puede utilizar la herramienta Covarianza para examinar cada uno de los pares de variables de medida a fin de determinar si las dos variables de medida tienden a variar conjuntamente, es decir, si los valores altos de una variable tienden a estar asociados con los valores altos de la otra (correlación positiva), si los valores bajos de una variable tienden a estar asociados con los valores bajos de la otra (correlación negativa) o si los valores de ambas variables tienden a no estar relacionados (correlación con tendencia a 0 (cero)).

MostrarEstadística descriptiva

La herramienta de análisis Estadística descriptiva genera un informe estadístico de una sola variable para los datos del rango de entrada, y proporciona información acerca de la tendencia central y la dispersión de los datos.

MostrarSuavización exponencial

La herramienta de análisis Suavización exponencial predice un valor que está basado en el pronóstico del período anterior, ajustado al error en ese pronóstico anterior. La herramienta utiliza la constante de suavización a, cuya magnitud determina la exactitud con la que los pronósticos responden a los errores en el pronóstico anterior.

 Nota   Los valores de 0,2 a 0,3 son constantes de suavización adecuadas. Estos valores indican que el pronóstico actual debe ajustarse entre un 20% y un 30% del error en el pronóstico anterior. Las constantes mayores generan una respuesta más rápida, pero pueden producir proyecciones erróneas. Las constantes más pequeñas pueden dar como resultado retrasos prolongados en los valores pronosticados.

MostrarPrueba F para varianzas de dos muestras

La herramienta de análisis Prueba F para varianzas de dos muestras ejecuta una Prueba F de dos muestras para comparar dos varianzas de población.

Por ejemplo, puede utilizar la herramienta Prueba F con muestras de los tiempos realizados por cada uno de los dos equipos de una competición de natación. La herramienta proporciona el resultado de la hipótesis nula de que estas dos muestras provengan de distribuciones con varianzas iguales frente a la alternativa de que las varianzas no sean iguales en las distribuciones subyacentes.

La herramienta calcula el valor f de una estadística F (o proporción F). Un valor de f cercano a 1 proporciona pruebas de que las varianzas de población subyacentes son iguales. En la tabla de resultados, si f < 1 “P(F <= f) de una cola” proporciona la probabilidad de observar un valor de la estadística F menor que f cuando las varianzas de población son iguales, y “Valor crítico de F de una cola” proporciona el valor crítico menor que 1 para el nivel de importancia elegido, Alfa. Si f > 1, “P(F <= f) de una cola” proporciona la probabilidad de observar un valor de la estadística F superior a f cuando las varianzas de población son iguales, y “Valor crítico de F de una cola” proporciona el valor crítico mayor que 1 para Alfa.

MostrarAnálisis de Fourier

La herramienta Análisis de Fourier resuelve problemas de sistemas lineales y analiza datos periódicos, transformándolos mediante el método de transformación rápida de Fourier (FFT, Fast Fourier Transform). Esta herramienta también realiza transformaciones inversas, en las que el inverso de los datos transformados devuelve los datos originales.

Rangos de entrada y salida en análisis de Fourier

MostrarHistograma

La herramienta de análisis Histograma calcula las frecuencias individuales y acumulativas de rangos de celdas de datos y de clases de datos. Esa herramienta genera datos acerca del número de apariciones de un valor en un conjunto de datos.

Por ejemplo, en una clase con 20 alumnos, puede determinarse la distribución de calificaciones mediante una categoría de puntuación por letras. Una tabla de histograma presentará los límites de las calificaciones por letras así como el número de calificaciones que haya entre el límite mínimo y el límite actual. La calificación única más frecuente es la moda de los datos.

MostrarMedia móvil

La herramienta de análisis Media móvil proyecta valores en el período de pronósticos, basándose en el valor promedio de la variable calculada durante un número específico de períodos anteriores. Una media móvil proporciona información de tendencias que se vería enmascarada por una simple media de todos los datos históricos. Utilice esta herramienta para pronosticar ventas, inventario u otras tendencias. Todos los valores de pronóstico están basados en la siguiente fórmula:

Fórmula para calcular medias móviles

donde:

  • N es el número de períodos anteriores que se incluyen en la media móvil
  • Aj es el valor real en la hora j
  • Fj es el valor pronosticado en la hora j

MostrarGeneración de números aleatorios

La herramienta de análisis Generación de números aleatorios rellena un rango con números aleatorios independientes extraídos de una de varias distribuciones. Puede utilizar esta herramienta para caracterizar a los sujetos de una población con una distribución de probabilidades.

Por ejemplo, puede utilizar una distribución normal para caracterizar la población de estatura de las personas o utilizar una distribución de Bernouilli con dos resultados posibles para caracterizar la población de resultados de un juego de azar.

MostrarJerarquía y percentil

La herramienta de análisis Jerarquía y percentil crea una tabla que contiene los rangos ordinales y porcentuales de cada valor de un conjunto de datos. Puede analizar la importancia relativa de los valores en un conjunto de datos. Esta herramienta utiliza las funciones JERARQUIA y RANGO.PERCENTIL de la hoja de cálculo. JERARQUIA no explica los valores relacionados. Si desea explicar valores relacionados, utilice la función JERARQUIA de la hoja de cálculo junto con el factor de corrección que se sugiere en el archivo de Ayuda para JERARQUIA.

MostrarRegresión

La herramienta de análisis Regresión efectúa el análisis de regresión lineal utilizando el método de "mínimos cuadrados" para ajustar una línea a un conjunto de observaciones. Puede utilizar esta herramienta para analizar la forma en que los valores de una o más variables independientes afectan a una variable dependiente.

Por ejemplo, puede analizar de qué modo inciden en el rendimiento de un atleta varios factores: la edad, la estatura y el peso. Basándose en un conjunto de datos de rendimiento, la regresión determinará la incidencia de cada uno de los factores en la medición del rendimiento y podrán utilizarse estos resultados para predecir el rendimiento de un atleta nuevo no sometido a ninguna prueba.

La herramienta Regresión utiliza la función ESTIMACION.LINEAL de la hoja de cálculo.

MostrarMuestreo

La herramienta de análisis Muestreo crea una muestra de población tratando el rango de entrada como una población. Cuando la población sea demasiado grande para procesarla o para presentarla gráficamente, puede utilizarse una muestra representativa. Además, si cree que los datos de entrada son periódicos, puede crear una muestra que contenga únicamente los valores de una parte determinada de un ciclo.

Por ejemplo, si el rango de entrada contiene cifras de ventas trimestrales, el muestreo realizado con una tasa periódica de cuatro permitirá colocar los valores del mismo trimestre en el rango de salida.

MostrarPrueba t

Las herramientas de análisis Prueba t de dos muestras permiten comprobar la igualdad de las medias de población que subyacen a cada muestra. Las tres herramientas utilizan diferentes suposiciones: que las varianzas de población son iguales, que las varianzas de población no son iguales y que las dos muestras representan observaciones anteriores y posteriores al tratamiento en los mismos sujetos.

Para las tres herramientas que figuran a continuación, se calcula un valor de la estadística T, t, y se muestra como “t Stat” en las tablas de resultados. Dependiendo de los datos, este valor t puede ser negativo o no negativo. Suponiendo medias de población subyacentes iguales, si t < 0, “P(T <= t) de una cola” proporciona la probabilidad de que se observe un valor de la estadística T que sea más negativo que t. Si t >=0, “P(T <= t) de una cola” proporciona la probabilidad de que se observe un valor de la estadística T que sea más positivo que t. “Valor crítico t de una cola” proporciona el valor de corte para que la probabilidad de observar un valor de la estadística t mayor o igual a “Valor crítico t de una cola” sea Alfa.

“P(T <= t) de dos colas” proporciona la probabilidad de que se observe un valor de la estadística T que sea mayor en valor absoluto que t. “Valor crítico P de dos colas” proporciona el valor de corte para que la probabilidad de una estadística T observada mayor en valor absoluto que “Valor crítico P de dos colas” sea Alfa.

Prueba t para dos muestras suponiendo varianzas iguales Esta herramienta de análisis ejecuta una Prueba t de Student en dos muestras. En este tipo de prueba se supone que los dos conjuntos de datos proceden de distribuciones con las mismas varianzas. Se conoce con el nombre de Prueba t homoscedástica. Puede utilizar este tipo de prueba para determinar si es probable que las dos muestras procedan de distribuciones con medias de población iguales.

Prueba t para dos muestras suponiendo varianzas desiguales Esta herramienta de análisis ejecuta una Prueba t de Student en dos muestras. En este tipo de prueba se supone que los dos conjuntos de datos proceden de distribuciones con varianzas desiguales. Se conoce con el nombre de Prueba t heteroscedástica. Al igual que en el caso anterior suponiendo varianzas iguales, este tipo de prueba puede utilizarse para determinar si es probable que las dos muestras procedan de distribuciones con medias de población iguales. Utilice esta prueba cuando haya sujetos distintos en las dos muestras. Utilice la prueba emparejada, que se describe en el ejemplo que figura más abajo, cuando exista un conjunto único de sujetos y las dos muestras representen las medidas de cada uno de los sujetos antes y después de un tratamiento.

La siguiente fórmula se utiliza para determinar el valor estadístico t.

Fórmula para calcular el valor t

La siguiente fórmula se utiliza para calcular los grados de libertad (grados_de_libertad). Puesto que el resultado del cálculo normalmente no es un entero, el valor de los grados de libertad se redondea al entero más próximo para obtener un valor crítico de la tabla t. La función PRUEBA.T de la hoja de cálculo de Excel utiliza el valor calculado de los grados de libertad sin redondeos, ya que es posible calcular un valor para PRUEBA.T con un valor de grados de libertad no entero. Debido a estos diferentes métodos para determinar los grados de libertad, los resultados de PRUEBA.T y esta herramienta Prueba t variarán en el caso de varianzas desiguales.

Fórmula para aproximar grados de libertad

Prueba t para medias de dos muestras emparejadas Puede utilizar una prueba emparejada cuando existe un par natural de observaciones en las muestras, como cuando un grupo de muestras se somete a prueba dos veces, antes y después de un experimento. Esta herramienta de análisis y su fórmula ejecutan una prueba t de Student de dos muestras emparejadas para determinar si las observaciones realizadas antes y después de un tratamiento proceden probablemente de distribuciones con medias de población iguales. En este tipo de prueba no se supone que las varianzas de ambas poblaciones sean iguales.

 Nota   Entre los resultados que se generan con esta herramienta se encuentra la varianza agrupada, una medición acumulada de la distribución de datos en torno a la media, que se deriva de la fórmula siguiente.

Fórmula para calcular la varianza agrupada

MostrarPrueba z

La herramienta de análisis Prueba z para medias de dos muestras realiza una Prueba z en las medias de dos muestras con varianzas conocidas. Esta herramienta se utiliza para comprobar las hipótesis nulas relativas a que no existen diferencias entre dos medias de población frente a las hipótesis alternativas en uno u otro sentido. Si no se conocen las varianzas, deberá utilizarse la función PRUEBA.Z de la hoja de cálculo.

Cuando se utiliza la herramienta Prueba z, hay que tener especial cuidado en comprender el resultado. “P(Z <= z) de una cola” es en realidad P(Z >= ABS(z)), la probabilidad de un valor z más allá de 0 en la misma dirección que el valor z observado cuando no hay diferencias entre las medias de población. “P(Z <= z) de dos colas” es realmente P(Z >= ABS(z) o Z <= -ABS(z)), la probabilidad de un valor z más allá de 0 en cualquier dirección que el valor z observado cuando no hay diferencias entre las medias de población. El resultado de dos colas es el resultado de una cola multiplicado por 2. La herramienta Prueba z también puede utilizarse para el caso en que la hipótesis nula sea que existe un valor distinto de cero específico para la diferencia entre las dos medias de población.

Por ejemplo, puede utilizarse esta prueba para determinar las diferencias entre el rendimiento de dos modelos de automóvil.

 
 
Corresponde a:
Excel 2003