Microsoft Office Online
Office Online にサインイン (サインインとは?) | サインイン

注意: このページはサポートされていない Web ブラウザで表示されています。この Web サイトは、Microsoft Internet Explorer 6.0 以降、Firefox 1.5、または Netscape Navigator 8.0 以降を使用すると、正しく表示されます。 サポートされているブラウザの詳細情報

印刷用ページの表示印刷用ページの表示 ブックマークを設定して共有共有
分析ツールについて
 

Microsoft Excel には、分析ツールと呼ばれるデータ分析ツールが用意されています。これらのツールを使うと、複雑な統計や技術計算に基づく分析を簡単に実行できます。これらのツールを使う場合は、データとパラメータを指定します。各ツールでは、統計または技術計算用のマクロ関数を使ってデータを分析し、その結果を出力テーブルに表示します。出力テーブルだけでなく、グラフを出力するツールもあります。

関連したワークシート関数   Excel には、統計、財務、およびエンジニアリングに関するワークシート関数が用意されています。統計関数には、Excel に組み込まれているものと、分析ツール アドインをインストールしてから利用できるものとがあります。

データ分析ツールへのアクセス 分析ツールには、以下のツールが含まれます。これらのツールにアクセスするには、[ツール] メニューの [分析ツール] をクリックします。[ツール] メニューに [分析ツール] コマンドが表示されない場合は、分析ツール アドイン (アドイン : Office に独自のコマンドや独自の機能を追加する追加プログラムです。) プログラムを読み込む必要があります。

表示分散分析

分散分析ツールを使用すると、さまざまな種類の分散分析を行うことができます。使用するツールは、検定する母集団の要因数と標本数によって決まります。

分散分析: 一元配置 このツールは、複数の標本のデータについて分散の簡単な分析を行います。この分析を行うと、すべての標本に関して基になる確率分布が同じではないという対立仮説に対して同じ確率分布からそれぞれの標本が得られるという仮説を検定することができます。標本が 2 つのみの場合は、TTEST ワークシート関数も同じように使用することができます。3 つ以上の標本については TTEST 関数は利用できませんが、代わりに一元配置分散分析モデルを使うことができます。

分散分析: 繰り返しのある二元配置 この分析ツールは、データを 2 つの異なる次元に従って分類できる場合に役立ちます。たとえば植物の高さを計測する実験では、その植物に A、B、C など異なる肥料を与え、低温、高温などの異なる温度環境に置く場合があります。{肥料、温度} の 6 種類の組み合わせそれぞれについて、植物の高さを同じ回数観察します。この分散分析ツールを使うと、以下の検定を行うことができます。

  1. 同じ母集団に異なる種類の肥料を与えた場合の植物の高さを測定します。この分析方法では温度環境を無視します。
  2. 同じ母集団を異なる温度環境に置いた場合の植物の高さを測定します。この分析方法では肥料の種類を無視します。
  3. 手順 1. での肥料の種類と手順 2. での温度環境の違いによる影響について考慮したことにより、同じ母集団から {肥料、温度} 値のすべての組み合わせに対応する 6 つの標本が得られます。この場合の対立仮説は、肥料の種類単独または温度環境単独における違いに対して、{肥料、温度} の特定の組み合わせによる影響があるということです。

分散分析ツール用に設定された入力範囲

分散分析: 繰り返しのない二元配置 この分析ツールは、繰り返しのある二元配置の場合と同じように、データを 2 つの異なる次元で分類する場合に役立ちます。ただしこのツールでは、1 つの組み合わせ (たとえば、前の例の場合は、{肥料、温度} の組み合わせの 1 つ) について、1 つの観察のみを行うと仮定します。このツールを使用すると、分散分析: 繰り返しのある二元配置の手順 1. と手順 2. の検定は行うことができますが、手順 3. の検定は、そのための十分なデータがないため、行うことができません。

表示相関

N 個の対象物それぞれに対して各変数の測定を行う場合、CORREL ワークシート関数と PEARSON ワークシート関数は共に 2 つの測定変数間の相関係数を計算します。いずれかの対象物に対する観察が行われないと、分析時にその対象物が無視されます。相関分析ツールは、N 個の対象物それぞれに対して 3 つ以上の測定変数がある場合に特に役立ちます。この分析を行うと、測定変数の可能な組み合わせそれぞれに対して適用された CORREL (または PEARSON) 関数の値を示した相関マトリクスが、出力テーブルとして得られます。

共分散と同じように、相関係数は 2 つの測定変数が一緒に変化する範囲で測定します。共分散とは異なり、相関係数は 2 つの測定変数を表現する単位とは関係なくその値の基準が決められます。たとえば、2 つの測定変数が重量と高さの場合、重量がポンドからキログラムに変更されても相関係数の値は変わりません。相関係数のすべての値は、-1 から +1 までの範囲に収まる必要があります。

相関分析ツールを使うと、測定変数の組み合わせそれぞれについて 2 つの測定変数が一緒に変化する傾向があるかどうかを調べることができます。一方の変数の大きな値がもう一方の変数の大きな値と関連する傾向があるか (正の相関)、一方の変数の小さな値がもう一方の変数の大きな値と関連する傾向があるか (負の相関)、両方の変数の値が関連しない傾向があるか (0 に近い相関) などを調べることができます。

表示共分散

一連の個別の対象物に対して測定される N 個の異なる測定変数がある場合、相関分析ツールと共分散分析ツールは同じ設定で使うことができます。相関分析ツールと共分散分析ツールは共に、測定変数の各組み合わせ間のそれぞれ相関係数または共分散を示すマトリクスが、出力テーブルとして得られます。相関係数が -1 から +1 までの範囲に収まるのに対し、対応する共分散はこの範囲に収まらない点が異なります。相関係数と共分散は共に、2 つの変数が一緒に変化する範囲で測定されます。

共分散分析ツールは測定変数のそれぞれの組み合わせについて COVAR ワークシート関数の値を計算します。たとえば N=2 の 2 つの測定変数のみの場合は、共分散分析ツールではなく COVAR 関数を直接使用する方法が適しています。共分散分析ツールの出力テーブルで対角線上の i 行と i 列の値は、それ自身の i 番目の測定変数の共分散を表します。これは、VARP ワークシート関数で計算されるその変数に対する母集団の分散の値と同じです。

共分散分析ツールを使うと、測定変数の組み合わせそれぞれについて 2 つの測定変数が一緒に変化する傾向があるかどうかを調べることができます。一方の変数の大きな値がもう一方の変数の大きな値と関連する傾向があるか (正の共分散)、一方の変数の小さな値がもう一方の変数の大きな値と関連する傾向があるか (負の共分散)、両方の変数の値が関連しない傾向があるか (0 に近い共分散) などを調べることができます。

表示基本統計量

基本統計量分析ツールは、入力範囲のデータを対象に、一変量による基本統計量を調べ、対象となるデータの主要な傾向と変動に関する情報を出力します。

表示指数平滑

指数平滑分析ツールは、前回の観測値と予測値との誤差を調整することにより、前回の予測値に基づいてデータを予測します。平滑化定数 a を使って計算します。この定数は、前回の予測値の誤差に対する予測値の反応の強さを決める値です。

 メモ   平滑化定数に指定する値は 0.2 ~ 0.3 が適しています。この範囲の値を使うと、現在の予測が前回の予測の 20 ~ 30 % の誤差に調整されます。定数に大きい値を指定すると、予測値の計算に必要な時間は短くなりますが、予測の誤差は大きくなります。定数に小さい値を指定すると、予測値の計算に必要な時間が長くなります。

表示F 検定 : 2 標本を使った分散の検定

F 検定 : 2 標本を使った分散の検定分析ツールは、2 つの標本を使った F 検定を行って、2 つの母集団の分散を比較します。

たとえば、2 つのチームそれぞれの水泳大会でのタイムの標本について F 検定ツールを使用することができます。このツールを使用すると、分散が基となる分布に等しくないという対立仮説に対して等しい分散の分布からこれら 2 つの標本が得られるという帰無仮説に対する検定の結果を求めることができます。

このツールは F 統計 (または F 比率) の値を計算します。f の値が 1 に近い場合は、基になる母集団の分散が等しいことを示します。出力テーブルでは、f < 1 の場合、"P(F <= f) 片側" で、母集団の分散が等しいときに f より小さい F 統計の値が測定される確率が求められ、"F 境界値 片側" で、選択した基準値のレベル Alpha に対して 1 未満の境界値が求められます。f > 1 の場合は、"P(F <= f) 片側" で、母集団の分散が等しいときに f より大きい F 統計の値が測定される確率が求められ、"F 境界値 片側" で、選択したレベル Alpha に対して 1 を超える境界値が求められます。

表示フーリエ解析

フーリエ解析分析ツールは、データを変換する高速フーリエ変換 (FFT) を使って線形システムの解を求め、周期データを分析します。この分析ツールは逆変換もサポートしているので、変換したデータを元のデータに戻すこともできます。

フーリエ解析の入力範囲と出力範囲

表示ヒストグラム

ヒストグラム分析ツールは、対象となるデータおよびデータ区間のセル範囲の個別頻度および累積頻度を計算します。この分析ツールを使って、データ グループに含まれる特定の値の出現頻度を求めます。

たとえば、20 人の学生を対象に、テストの点数をアルファベットで段階に分けて評価し、成績の度数分布を調べるとします。このとき、ヒストグラム テーブルには、各段階の境界値と、それぞれの段階に属する点数の頻度が表示されます。最も出現頻度の高い点数がデータのモード (最頻値) です。

表示移動平均

移動平均分析ツールは、一定数の過去の観測値の平均値に基づき、将来の値を予測します。移動平均を使うと、過去のデータを平均するだけではわからない傾向についての情報を予測できます。売り上げや棚卸しなどの傾向を予測するには、この分析ツールを使います。予測値は、次の数式を基に計算されます。

移動平均を算出する数式

ここで

  • N は、移動平均の計算に使う過去の観測値の個数です。
  • Aj は、j 回目の観測値です。
  • Fj は、j 回目の予測値です。

表示乱数発生

乱数発生分析ツールは、複数の分布の 1 つを基に発生させた、独立した乱数を範囲に入力します。一定の確率分布を使って母集団を特徴付けるには、この分析ツールを使います。

たとえば、個人の身長の測定結果を特徴付けるには正規分布を使います。また、2 とおりの結果しか得られないコイン投げなどの結果を特徴付けるにはベルヌーイ分布を使います。

表示順位と百分位数

順位と百分位数分析ツールは、対象となるデータ グループに含まれる各値に対して、その順位と百分位を含む出力テーブルを作成します。このツールを使って、対象となるデータ グループの中での、各値の相対的な位置を分析します。このツールは RANK ワークシート関数と PERCENTRANK ワークシート関数を使います。RANK 関数は結合値を扱いません。結合値を扱う場合は、RANK のヘルプ ファイルで説明されている補正要因と共に RANK ワークシート関数を使用します。

表示回帰分析

回帰分析ツールは、線形回帰分析を行います。回帰分析では、R-2 乗値を使って、観測値のデータが最適な直線に当てはめられます。このツールを使って、複数の独立変数が 1 つの従属変数に与える影響を分析することができます。

たとえば、スポーツ選手の年齢、身長、体重などの要素が成績に与える影響を分析できます。成績データに基づいて、これらの要素それぞれが成績に影響した比率を割り当てたり、回帰分析の結果を使って、ほかのスポーツ選手の成績を予測することもできます。

回帰分析ツールは LINEST ワークシート関数を使用します。

表示サンプリング

サンプリング分析ツールは、入力範囲のデータを母集団と見なし、母集団から標本を抽出します。母集団の規模が大きすぎて統計処理やグラフ化が困難な場合は、母集団全体ではなく標本を対象に分析すると便利です。また、入力データにある種の周期性が認められる場合は、周期の特定部分から一定数の標本を抽出することもできます。

たとえば、入力範囲に四半期ごとの売上高が入力されている場合、周期を 4 に設定すると、同じ四半期の売上高だけを出力テーブルに抽出できます。

表示t 検定

2 標本による t 検定分析ツールは、各標本の基になる母集団の平均の等しさを検定します。母集団の分散が等しいという仮定、母集団の分散が等しくないという仮定、および 2 つの標本が同じ対象物についての処理の前と後の測定を表すという仮定、という 3 つの異なる仮定に 3 つのツールを使用します。

以下の 3 つのツールすべてにおいて、t 統計値 t が計算されて出力テーブルに "t Stat" として示されます。データに応じてこの t という値は負の値にも正の値にもなります。基になる母集団の平均値が等しいとする仮定では、t < 0 の場合、"P(T <= t) 片側" で、t より小さい t 統計の値が測定される確率が求められます。t >=0 の場合は、"P(T <= t) 片側" で、t より大きい t 統計の値が測定される確率が求められます。"t 境界値 片側" で、"t 境界値 片側" より大きいか等しい t 統計の値が測定される確率が Alpha になるような区分値が求められます。

"P(T <= t) 両側" で、絶対値が t よりも大きい t 統計の値が測定される確率が求められます。"P 境界値 両側" で、絶対値が "P 境界値 両側" より大きい t 統計の値が測定される確率が Alpha になるような区分値が求められます。

t 検定: 等分散を仮定した 2 標本による検定   2 つの標本を使ったスチューデントの t 検定を行います。この形式の t 検定では、2 つのデータ セットが同じ分散の分布から求められると仮定するため、等分散 t 検定とも呼ばれます。2 つの標本が母集団の等しい平均値の分布から求められるかどうかを調べるためにこの t 検定を使います。

t 検定: 分散が等しくないと仮定した 2 標本による検定   2 つの標本を使ったスチューデントの t 検定を行います。この形式の t 検定では、2 つのデータ グループが、等しくない分散の分布から求められると仮定するため、異分散 t 検定とも呼ばれます。等分散の場合と同じように、この t 検定は、2 つの標本が母集団の等しい平均値の分布から求められるかどうかを調べるために使用することができます。2 つの標本に他とははっきり異なる対象物がある場合は、こちらの検定方法を使います。単一の一連の対象物と各対象物の処理の前と後の測定を表す 2 つの標本がある場合は、次に説明する一対の標本による平均の検定を使います。

統計定数 t を決めるには、次の数式を使います。

統計定数 t を算出する数式

自由度 df を計算するには、次の数式を使用します。通常は計算結果が整数ではないため、t テーブルからの境界値を求める際に、df の値が最も近い整数に四捨五入されます。Excel のワークシート関数 TTEST は、整数以外の df 値で TTEST の値を計算できるため、計算された df 値が四捨五入されずそのまま使われます。自由度を決める方法のこの違いのために、異分散における TTEST とこの t 検定ツールの結果は異なります。

自由度を概算する数式

t 検定: 一対の標本による平均の検定 1 つの標本グループをある実験の前後で 2 度検定する場合のように、2 つの観測値に自然な対の関係がある場合は、この形式の t 検定を使います。この分析ツールとその数式は、一対の標本を使ったスチューデントの t 検定を行い、処理の前に行われた測定と処理の後に行われた測定が、母集団の等しい平均値の分布から求められたかどうかを調べます。この形式の t 検定では、データ グループを抽出した 2 つの母集団の分散が等しいことを前提としません。

 メモ   この分析ツールを使って出力する結果には、次の数式で求められる、プールされた分散 (結果に関するデータの分散がプールされた量) が現れることもあります。

プールされた分散を算出する数式

表示z 検定

z 検定: 2 標本による平均の検定分析ツールは、既知の分散を使って、2 つの標本を対象に平均値の z 検定を行います。この分析ツールを使って、片面または両面の対立仮説いずれかに対して 2 つの母集団の平均値の間に有意な差がないという帰無仮設を検定します。分散が未知の場合は、代わりに ZTEST ワークシート関数を使う必要があります。

z 検定分析ツールを使う場合は、出力を詳しく調べる必要があります。"P(Z <= z) 片側" は実際には P(Z >= ABS(z)) を表し、母集団の平均値に差がない場合、z 値の確率は測定される z 値と同じ方向に 0 から遠い値になります。"P(Z <= z) 両側" は実際には P(Z >= ABS(z) or Z <= -ABS(z)) を表し、母集団の平均値に差がない場合、z 値の確率は測定される z 値のいずれかの方向に 0 から遠い値になります。両側の結果は、片側のちょうど 2 倍の値になります。z 検定分析ツールは、2 つの母集団の平均値の差が 0 以外の特定の値であるという仮説が帰無仮説となる場合に使用することもできます。

たとえば、z 検定を行うと、2 種類の車の性能の差異を検定できます。

© 2009 Microsoft Corporation. All rights reserved.