À propos des outils d'analyse statistique

Microsoft Excel propose un ensemble d'outils d'analyse de données (nommé Utilitaire d'analyse) qui vous permettent de passer quelques étapes lors du développement d'analyses statistiques ou techniques complexes. Vous fournissez les données et les paramètres pour chaque analyse ; l'outil utilise les macro-fonctions statistiques ou techniques appropriées, puis il affiche les résultats dans une table de sortie. Certains outils génèrent des graphiques en plus des tables de sortie.

Fonctions de feuilles de calcul associées Excel fournit de nombreuses autres fonctions de feuille de calcul statistiques, financières et techniques. Certaines des fonctions statistiques sont intégrées, tandis que d'autres deviennent disponibles lorsque vous installez l'Utilitaire d'analyse.

Accès aux outils d'analyse de données L'Utilitaire d'analyse contient les outils décrits ci-dessous. Pour accéder à ces outils, cliquez sur Utilitaire d'analyse dans le menu Outils. Si la commande Utilitaire d'analyse n'est pas disponible, vous devez charger le programme de macros complémentaires (macro complémentaire : programme complémentaire qui ajoute des commandes personnalisées ou des fonctions personnalisées à Microsoft Office.) Utilitaire d'analyse.

AfficherAnalyse de variance

Les outil d'analyse Variance fournissent différents types d'analyse de variance. L'outil à utiliser dépend du nombre de facteurs et du nombre d'échantillons dont vous disposez pour les populations à tester.

Analyse de variance : un facteur Cet outil effectue une analyse de variance simple sur des données pour deux ou plusieurs échantillons. L'analyse fournit un test de l'hypothèse selon laquelle chaque échantillon est tiré de la même distribution de probabilité sous-jacente par rapport à l'autre hypothèse selon laquelle les distributions de probabilité sous-jacentes ne sont pas identiques pour tous les échantillons. S'il n'y avait que deux échantillons, la fonction de feuille de calcul TEST.STUDENT pourrait aussi bien être utilisée. Avec plus de deux échantillons, il n'existe aucune généralisation pratique de TEST.STUDENT et vous pouvez utiliser le modèle Analyse de variance : un facteur à la place.

Analyse de variance : deux facteurs avec répétition d'expérience Cet outil d'analyse est utile lorsque les données peuvent être classées selon deux dimensions différentes. Par exemple, dans une expérience visant à mesurer la taille de plantes, on peut nourrir les plantes de différentes marques d'engrais (par exemple, A, B, C) et également les conserver à différentes températures (par exemple, basse et élevée). Pour chacune des six paires possibles {engrais, température}, nous avons une quantité égale d'observations de taille de plante. Cet outil de Variance nous permet de tester :

  1. Si les tailles des plantes pour les différentes marques d'engrais sont tirées de la même population sous-jacente ; les températures sont ignorées pour cette analyse.
  2. Si les tailles des plantes pour les différents niveaux de température sont tirées de la même population sous-jacente ; les marques d'engrais sont ignorées pour cette analyse.
  3. Si, ayant constaté les effets des différences entre les marques d'engrais trouvées à l'étape 1 et des différences entre les températures trouvées à l'étape 2, les six échantillons représentant toutes les paires de valeurs {engrais, température} sont tirées de la même population. L'autre hypothèse est qu'il existe des effets dus à des paires spécifiques {engrais, température} au-delà des différences basées uniquement sur l'engrais ou uniquement sur la température.

Définition de la plage d'entrée pour l'outil de variance

Analyse de variance : deux facteurs sans répétition d'expérience Cet outil d'analyse est utile lorsque les données sont classées selon deux dimensions différentes, comme dans le scénario « deux facteurs avec réplication ».Par contre, pour cet outil nous supposons qu'il n'existe qu'une seule observation pour chaque paire (par exemple chaque paire {engrais, température} dans l'exemple ci-dessus. Cet outil nous permet d'appliquer les étapes des étapes 1 et 2 du scénario « Analyse de variance : deux facteurs avec répétition d'expérience », mais nous ne disposons pas de données suffisantes pour appliquer le test de l'étape 3.

AfficherAnalyse de corrélation

Les fonctions de feuille de calcul COEFFICIENT.CORRELATION et PEARSON calculent le coefficient de corrélation entre deux variables de mesure lorsque des mesures sur chaque variable sont observées pour chacun des N sujets. (Toute observation manquante pour tout sujet fait en sorte que ce sujet est ignoré lors de l'analyse.) L'outil Analyse de corrélation est particulièrement utile lorsqu'il existe plus de deux variables de mesure pour chacun des N sujets. Il fournit une table de sortie, une matrice de corrélation indiquant la valeur de COEFFICIENT.CORRELATION (ou PEARSON) appliqué à chaque paire possible de variables de mesure.

Le coefficient de corrélation, comme la covariance, est une mesure de l'étendue selon laquelle deux variables de mesure « varient ensemble ». Contrairement à la covariance, le coefficient de corrélation est mis à l'échelle de sorte que sa valeur est indépendante des unités dans lesquelles les deux variables de mesure sont exprimées. (Par exemple, si les deux variables de mesure sont le poids et la hauteur, la valeur du coefficient de corrélation reste inchangée si le poids est converti des livres en kilogrammes.) La valeur de tout coefficient de corrélation doit être comprise entre -1 et +1 compris.

Vous pouvez utiliser l'outil d'analyse de corrélation pour examiner chaque paire de variables de mesure afin de déterminer si les deux variables de mesure tendent à se déplacer ensemble, autrement dit si les grandes valeurs d'une variable tendent à être associées avec les grandes valeurs de l'autre (corrélation positive), si les petites valeurs d'une variable tendent à être associées avec les petites valeurs de l'autre (corrélation négative) ou si les valeurs des deux variables tendent à ne pas être associées (corrélation proche de zéro).

AfficherAnalyse de covariance

Les outils Analyse de corrélation et Analyse de covariance peuvent tous deux être utilisés avec le même paramètre, lorsque vous avez N variables de mesure différentes observées sur un ensemble d'individus. Les outils Analyse de corrélation et Analyse de covariance génèrent chacun une table de sortie, une matrice indiquant respectivement le coefficient de corrélation ou la covariance entre chaque paire de variables de mesure. La différence réside dans le fait que les coefficients de corrélation sont mis à l'échelle de façon à résider entre -1 et +1 compris, alors que les covariances correspondantes ne sont pas mises à l'échelle. Le coefficient de corrélation et la covariance sont tous deux des mesures de l'étendue selon laquelle deux variables « varient ensemble ».

L'outil Analyse de covariance calcule la valeur de la fonction de feuille de calcul COVARIANCE pour chaque paire de variables de mesure. (L'utilisation directe de COVARIANCE plutôt que de l'outil Analyse de covariance est une alternative raisonnable lorsqu'il n'existe que deux variables de mesure, c'est-à-dire N=2.) L'entrée sur la diagonale de la table de sortie de l'outil Analyse de covariance sur la ligne i, colonne i est la covariance de la variable de mesure i-ème avec elle-même ; il s'agit simplement de la variance de population pour cette variable telle que calculée par la fonction de feuille de calcul VAR.P.

Vous pouvez utiliser l'outil d'analyse de covariance pour examiner chaque paire de variables de mesure afin de déterminer si les deux variables de mesure tendent à se déplacer ensemble, autrement dit si les grandes valeurs d'une variable tendent à être associées avec les grandes valeurs de l'autre (covariance positive), si les petites valeurs d'une variable tendent à être associées avec les petites valeurs de l'autre (covariance négative) ou si les valeurs des deux variables tendent à ne pas être associées (covariance proche de zéro).

AfficherStatistiques descriptives

L'outil d'analyse Statistiques descriptives génère un rapport de statistique univariate pour les données dans la plage d'entrée, ce qui fournit des informations sur la tendance centrale et la variabilité de vos données.

AfficherLissage exponentiel

L'outil d'analyse Lissage exponentiel prévoit une valeur basée sur la prévision pour la période précédente, avec ajustement pour l'erreur dans cette prévision précédente. L'outil utilise la constante de lissage a, dont la magnitude détermine l'étendue avec laquelle les prévisions répondent aux erreurs dans la prévision précédente.

 Remarque   Les valeurs 0,2 à 0,3 sont des constantes de lissage raisonnables. Ces valeurs indiquent que la prévision actuelle doit être ajustée de 20 à 30 pour cent pour erreur dans la prévision précédente. Les constantes plus élevées produisent une réponse plus rapide, mais peuvent générer des projections erratiques. Les constantes plus faibles peuvent entraîner de longs retards pour les valeurs prévisionnelles.

AfficherTest d'égalité des variances (F-Test)

L'outil d'analyse Test d'égalité des variances (F-Test) effectue un test F à deux échantillons afin de comparer deux variances de population.

Vous pouvez par exemple utiliser l'outil F-Test sur des échantillons de temps pour une compétition de natation pour chacune des deux équipes. L'outil fournit le résultat d'un test de l'hypothèse nulle selon laquelle ces deux échantillons proviennent de distributions avec des variances égales contre l'alternative selon laquelle les variances ne sont pas égales dans les distributions sous-jacentes.

L'outil calcule la valeur f d'une F-statistique (ou un F-ratio). Une valeur de f proche de 1 fournit la preuve que les variances de population sous-jacentes sont égales. Dans la table de sortie, si f < 1 « P(F <= f) unilatérale » donne la probabilité d'observer une valeur de F-statistique inférieure à f lorsque les variances de population sont égales et « F Critique unilatérale » donne la valeur critique inférieure à 1 pour le seuil de signification choisi, Alpha. Si f > 1, « P(F <= f) unilatérale » donne la probabilité d'observer une valeur de F-statistique supérieure à f lorsque les variances de population sont égales et « F Critique unilatérale » donne la valeur critique supérieure à 1 pour Alpha.

AfficherTransformation de Fourier Rapide (FFT)

L'outil Transformation de Fourier Rapide (FFT) résout des problèmes dans les systèmes linéaires et analyse des données périodiques en utilisant la méthode Fast Fourier Transform (FFT) pour transformer des données. Cet outil prend également en charge les transformations inverses, dans lesquelles l'inverse des données transformées renvoie les données d'origine.

Plages d'entrée et de sortie pour la Transformation de Fourier Rapide (FFT)

AfficherHistogramme

L'outil d'analyse Histogramme calcule les fréquences individuelles et cumulées pour une plage de cellules de données et de binaires de données. Cet outil génère des données pour le nombre d'occurrences d'une valeur dans une série de données.

Par exemple, dans une classe de 20 étudiants, vous pourriez déterminer la distribution des scores dans des catégories de notes par lettre. Un tableau d'histogramme présente les limites de notes par lettre et le nombre de scores entre la limite la plus basse et la limite actuelle. Le score le plus fréquent est le mode des données.

AfficherMoyenne mobile

L'outil Moyenne mobile projette des valeurs dans la période de prévision en fonction de la valeur moyenne de la variable sur un nombre spécifique de périodes précédentes. Une moyenne mobile fournit des informations de tendances qu'une simple moyenne de toutes les données historiques masquerait. Utilisez cette fonctionnalité pour prévoir des ventes, inventaires ou autre tendances. Chaque valeur de prévision est basée sur la formule suivante.

Formule permettant de calculer les moyennes mobiles

où :

  • N est le nombre de périodes précédentes à inclure dans la moyenne mobile
  • Aj est la valeur réelle au moment j
  • Fj est la valeur de prévision au moment j

AfficherGénération de nombres aléatoires

L'outil d'analyse Génération de nombres aléatoires remplit une plage avec des nombres aléatoires indépendants tirés d'une ou plusieurs distributions. Vous pouvez caractériser des sujets d'une population avec une distribution de probabilité.

Vous pouvez par exemple utiliser une distribution normale pour caractériser la population des tailles d'individus ou utiliser une distribution Bernoulli de deux issues possibles pour caractériser la population de résultats de tirages à pile ou face.

AfficherAnalyse de position

L'outil Analyse de position produit une table qui contient le rang ordinal et pourcentage de chaque valeur d'une série de données. Vous pouvez analyser la position relative des valeurs d'une série de données. Cet outil utilise les fonctions de feuille de calcul RANG et RANG.POURCENTAGE. RANG ne tient pas compte des valeurs liées. Si vous souhaitez prendre en compte les valeurs liées, utilisez la fonction de feuille de calcul RANG avec le facteur de correction suggéré dans le fichier d'aide de RANG.

AfficherRégression linéaire

L'outil d'analyse Régression linéaire effectue une analyse de régression linéaire en utilisant la méthode des « moindres carrés » pour adapter une ligne à un ensemble d'observations. Vous pouvez analyser la façon dont une seule variable dépendante est affectée par les valeurs d'une ou plusieurs variables indépendantes.

Vous pouvez par exemple analyser la manière dont les performances d'un athlète sont affectées par des facteurs tels que l'âge, la hauteur et le poids. Vous pouvez affecter des parts de la mesure de performances à chacun de ces trois facteurs en fonction d'un ensemble de données de performances, puis utiliser les résultats pour prévoir les performances d'un nouvel athlète qui n'a encore jamais été testé.

L'outil Régression linéaire utilise la fonction de feuille de calcul DROITEREG.

AfficherÉchantillonnage

L'outil d'analyse Échantillonnage crée un échantillon à partir d'une population en traitant la plage d'entrée comme une population. Lorsque la population est trop grande pour être traitée ou dessinée, vous pouvez utiliser un échantillon représentatif. Vous pouvez également créer un échantillon qui contient uniquement des valeurs d'une partie spécifique d'un cycle si vous pensez que les données d'entrées sont périodiques.

Par exemple, si la plage d'entrée contient des chiffres de vente trimestriels, vous devez échantillonner avec des valeurs aux taux périodique de quatre places du même trimestre dans la plage de sortie.

AfficherTest d'égalité des espérances

Les outils d'analyse Test d'égalité des espérances à deux échantillons testent l'égalité de la moyenne de population sous-jacente à chaque échantillon. Les trois outils utilisent des hypothèses différentes : que les variances de population sont égales, que les variances de population ne sont pas égales et que les deux échantillons représentent des observations avant traitement et après traitement sur les mêmes objets.

Pour les trois outils ci-dessous, une valeur t-Statistique, t, est calculée et affichée comme « t Stat » dans les tables de sortie. Selon les données, cette valeur t peut être négative ou non négative. Selon l'hypothèse d'une moyenne de population sous-jacente égale, si t < 0, « P(T <= t) unilatérale » donne la probabilité que la valeur de la t-Statistique observée serait plus négative que t. Si t >=0, « P(T <= t) unilatérale » donne la probabilité que la valeur de la t-Statistique observée serait plus positive que t. « t Critique unilatérale » donne la valeur seuil de sorte que la probabilité d'observer une valeur de la t-Statistique supérieure ou égale à « t Critique unilatérale » est Alpha.

« P(T <= t) bilatérale » donne la probabilité que la valeur de la t-Statistique observée serait plus grande en valeur absolue que t. « P Critique bilatérale » donne la valeur seuil de sorte que la probabilité d'une t-Statistique observée plus grande en valeur absolue que « P Critique bilatérale » est Alpha.

Test d'égalité des espérances : deux observations de variances égales Cet outil d'analyse effectue un test d'égalité d'étudiants à deux échantillons. Cette forme de test d'égalité suppose que les deux séries de données proviennent de distributions avec les mêmes variances. On appelle cela un t-test homoscédastique. Vous pouvez utiliser ce t-test pour déterminer s'il est probable que les deux échantillons provenaient de distributions avec des moyennes de population égales.

Test d'égalité des espérances : deux observations de variances différentes Cet outil d'analyse effectue un test d'égalité d'étudiants à deux échantillons. Cette forme de test d'égalité suppose que les deux séries de données proviennent de distributions avec des variances différentes. On appelle cela un t-test homoscédastique. Comme avec le scénario de variances égales ci-dessus, vous pouvez utiliser ce t-test pour déterminer s'il est probable que les deux échantillons provenaient de distributions avec des moyennes de population égales. Utilisez ce test lorsqu'il existe des sujets distincts dans les deux échantillons. Utilisez le test de paire décrit ci-dessous lorsqu'il n'y a qu'un seul ensemble de sujets et que les deux échantillons représentent des mesures pour chaque sujet avant et après un traitement.

La formule suivante permet de déterminer la valeur statistique t.

Formule permettant de calculer la valeur t

La formule suivante est utilisée pour calculer le degré de liberté, df. Le résultat du calcul n'étant généralement pas un nombre entier, la valeur de df est arrondie à l'entier le plus proche afin d'obtenir une valeur critique à partir de la table t. La fonction de feuille de calcul Excel TEST.STUDENT utilise la valeur df calculée sans arrondi car il est possible de calculer une valeur pour TEST.STUDENT avec un df de type non entier. Étant donné ces différentes méthodes de détermination du degré de liberté, les résultats de TEST.STUDENT et de cet outil t-Test différeront dans le scénario à variances différentes.

Formule permettant d'obtenir une approximation du degré de liberté

Test d'égalité des espérances : observations pairées Vous pouvez utiliser un test pairé lorsqu'il existe une paire naturelle d'observations dans les échantillons, par exemple lorsqu'un groupe d'échantillons est testé à deux reprises — avant et après une expérience. Cet outil d'analyse et sa formule effectuent un t-test à deux échantillons pairés afin de déterminer s'il est probable que les observations réalisées avant un traitement et celles réalisées après provenaient de distributions avec des moyennes de population égales. Cette forme de t-test ne suppose pas que les variances des deux populations sont égales.

 Remarque   Parmi les résultats générés par cet outil figure la variance pondérée, une mesure cumulée de la propagation des données autour de la moyenne, dérivée de la formule suivante.

Formule permettant de calculer la variance pondérée

AfficherTest de la différence significative minimale (z-test)

Le Test de la différence minimale significative (z-test) effectue un z-test de moyenne à deux échantillons avec des variances connues. Cet outil est utilisé pour tester l'hypothèse nulle selon laquelle il n'existe aucune différence entre deux moyennes de population par rapport à des hypothèses alternatives unilatérales ou bilatérales. Si les variances sont inconnues, la fonction de feuille de calcul TEST.Z doit plutôt être utilisée.

Lors de l'utilisation de l'outil z-test, il convient de bien comprendre la sortie. « P(Z <= z) unilatérale » est en fait P(Z >= ABS(z)), la probabilité d'une valeur z plus éloignée de 0 dans la même direction que la valeur z observée lorsqu'il n'existe aucune différence entre les moyennes de population. « P(Z <= z) unilatérale » est en fait P(Z >= ABS(z) ou Z <= -ABS(z)), la probabilité d'une valeur z plus éloignée de 0 dans l'une ou l'autre direction que la valeur z observée lorsqu'il n'existe aucune différence entre les moyennes de population. Le résultat bilatéral est simplement le résultat unilatéral multiplié par deux. L'outil z-test peut également être utilisé pour les scénarios dans lesquels l'hypothèse nulle est qu'il existe une valeur spécifique différente de zéro pour la différence entre les deux moyennes de population.

Vous pouvez par exemple utiliser ce test pour déterminer les différences entre les performances de deux modèles de voiture.

 
 
S'applique à :
Excel 2003