關於統計分析工具

Microsoft Excel 提供了一組資料分析工具,稱為 [分析工具箱],該組工具可讓您在建立複雜統計或工程分析時節省步驟。您只需為每一個分析提供必要的資料和參數,該工具就會使用正確的統計或工程巨集函數,在輸出表格中顯示相對的結果。其中有些工具在產生輸出表格時,同時還可繪製圖表。

相關的工作表函數 Excel 還提供許多其他統計、財務以及工程上的工作表函數。某些統計函數是內建函數,有些函數則只能在安裝過 [分析工具箱] 之後才能使用。

存取資料分析的工具 [分析工具箱] 包含下列工具。若要存取這些工具,請按 [工具] 功能表上的 [資料分析]。如果 [資料分析] 指令無法使用,您必須載入 [分析工具箱] 的增益集 (增益集:將自訂指令或自訂功能新增至 Microsoft Office 的補充程式。)程式。

顯示Anova

Anova 分析工具提供了用於變異數分析的各類工具。究竟要使用哪一工具則取決於因素個數及待檢定樣本總體中所含樣本的個數。

Anova: Single Factor 此工具針對二或多個範例在資料上執行變異數的簡單分析。此分析提供了一項測試,假設每個樣本皆來自相同機率,對照於不是來自相同樣本中之機率的另一假設。如果只有二個樣本,也同樣可使用工作表中的 TTEST 函數。對於二個以上的樣本,使用 TTEST 較不方便,則您可以取而代之使用 Single Factor Anova 模型。

Anova: Two-Factor With Replication 此分析工具用於當資料可用二種不同的規格加以分類時。例如,在一項測量植物高度的實驗中,植物可能被施予不同品牌的肥料 (例如, A、B、 C),且可種植在不同的溫度之中 (例如,低溫、高溫)。針對 6 種可能的組合 {肥料,溫度},我們觀察植物的高度有相同的數字。使用 Anova 工具,我們可以測試:

  1. 施予不同品牌肥料之植物的高度是否來自相同的母體;在此分析中會忽略溫度。
  2. 在不同溫度下植物的高度是否來自相同的母體;在此分析中會忽略肥料的品牌。
  3. 不論是否將在步驟 1 中發現不同肥料品牌的影響,及步驟 2 中溫度差異的影響計算進去,這 6 個樣本都表示所有 {肥料, 溫度} 的組合皆來自相同的母體。另一個假設則是基於特定 {肥料, 溫度} 組合對差異性所造成的效果,而差異性可能僅受肥料或溫度單方面影響。

輸入 Anova 工具的範圍設定

Anova: Two-Factor Without Replication 此分析工具在當資料以二種不同規格加以分類時 (如同在 Replication 中 Two-Factor 的例子) 是非常有用的。然而,對於此工具我們假設每一組合 (例如,在上例中的每一組 {肥料, 溫度}) 只有一項觀察重點。使用此工具我們可以將測試套用至 Anova 的步驟 1 及 2 的 Anova: Two-Factor With Replication 的例子,但沒有足夠的資料可以將測試套用至步驟 3。

顯示相關係數

CORREL 及 PEARSON 工作表函數在針對每 N 個實驗對象觀察每個變異數上的測量單位時,皆會計算 2 個測量單位變異數間的相關係數。(任何實驗對象所遺失的觀察資料都將導致實驗對象會在分析中被忽略。) 當每 N 個實驗對象有多於 2 個測量單位變異數時,Correlation 分析工具十分有用。它提供一個相關矩陣的表格,顯示出套用到測量單位變異數的每一個可能組合的 CORREL (PEARSON) 數值。

相關係數,就如同共變數一樣,是 2 個測量單位變異數之間「共同變化」的測量單位。不同於共變數的一點是,相關係數是經過調整的,其數值在 2 個測量單位變異數所用的單位中是獨立的。(例如,如果 2 個測量單位變異數為重量及高度,若重量的單位從磅換成公斤,其相關係數的數值將不會改變。) 任何相關係數的數值必須是包含在 -1 及 +1 之間的數值。

您可以使用相關分析工具來檢查每組測量單位變異數以判斷兩個測量單位變異數是否有一起移動的趨勢。也就是說,一組變異數大的數值和另一組變異數大的數值是否有相關的趨勢 (正相關),或是一組變異數小的數值和另一組變異數大的數值是否有相關的趨勢 (負相關),或兩組變異數的數值有彼此無關的趨勢 (相關係數趨近於零)。

顯示共變數

在一組個體上觀察 N 個不同的測量單位變異數時,可以相同設定使用 Correlation 及 Covariance 工具。Correlation 及 Covariance 工具皆會提出一份表格 (矩陣式),在每組測量變異數間個別顯示相關係數或共變數。不同點在於相關係數經由調整後介於 -1 及 +1 數值之間,而共變數則未經調整。相關係數及共變數二者都是 2 個變數間「一起變化」的測量單位。

Covariance 工具為每組測量單位變異數計算工作表函數中 COVAR 的數值。(當只有 2 個測量單位變異數時,如 N=2,直接使用 COVAR 而不用 Covariance 工具是合理的替代方式。) 在共變數工具提出之表格 i 列的斜向項目中,欄 i 是共用數本身第 i 項的測量單位變異數,這是由工作表中 VARP 函數所計算之該變異數中的母體變異數。

您可以使用共變數工具來檢查每組測量單位變異數以判斷兩個測量單位變異數是否有一起移動的趨勢 — 亦即,一組變異數大的數值和另一組變異數大的數值是否有相關的趨勢 (正共變數),或是一組變異數小的數值和另一組變異數大的數值是否有相關的趨勢 (負共變數),或兩組變異數的數值彼此有無相關的趨勢 (共變數趨近於零)。

顯示敘述統計

此敘述統計分析工具可產生輸入範圍資料的單一變數統計報表,它提供了資料的中央離差趨勢估計和變化的資訊。

顯示指數平滑法

指數平滑分析工具會根據先前週期的預報來預測數值,數值會隨著先前預報的誤差而調整。這個工具使用平滑常數 a 的大小來決定此次預測反映先前預測之誤差的程度為何。

 附註   0.2 到 0.3 的值為合理的平滑常數。這些數值表示目前的預測應根據先前的預測誤差而調整 20% 到 30 %。常數值愈大可產生較快的回應速度,但也可能產生反常的情況。較小的常數值則可能產生預測值嚴重落後的結果。

顯示F-檢定:兩個常態母體變異數的檢定

F 檢定:兩個常態母體變異數的檢定] 分析工具執行兩個常態母體的 F 檢定以比較兩個母體變異數。

例如,您可以於游泳比賽的樣本中多次在 2 支隊伍上使用 F 檢定工具。此工具提供一個無效假設的測試結果,該假設設定這 2 個樣本是從擁有相同變異數的分配中產生,並與基本分配中變數不相同的分配互相對照。

此工具會計算 F 統計值 (或 F 比率) 的數值。接近 1 的 f 值提供了母體變異數為相同的證據。在結果表格中,如果 f < 1「P(F <= f) 單尾」,顯示出觀察 F 統計值的機率小於 f (當母體變數為相同),而「F Critical 單尾」顯示對於所選擇的 Alpha 臨界值小於 1。如果 f > 1, 「P(F <= f) 單尾」顯示出觀察 F 統計值的機率大於 f (當母體變異數為相同),則「F Critical 單尾」顯示 Alpha 的臨界值大於 1。

顯示傅立葉分析

傅立葉分析工具使用快速傅立葉轉換 (FFT) 法來轉換資料,以解決線性系統中的問題,並分析週期性的資料。這個工具也提供倒轉的轉換功能,轉換資料的倒轉結果可得到原本的資料。

傅立葉分析的輸入與輸出範圍

顯示長條圖

長條圖分析工具計算儲存格範圍資料與資料區間的個別和累積頻率。這個工具產生的資料為資料組中某個數值出現的次數。

例如,在 20 位學生的班級中,您可以使用字母等級來區分成績的高低。長條圖表格代表成績等級字母的界線以及在最低等級和目前等級之間的成績個數。最常出現的成績等級為資料的眾數。

顯示移動平均

移動平均分析工具 根據先前數個週期的變數平均值,以影射預測週期中的數值。移動平均可以提供趨勢資訊,這是所有歷史資料的簡單平均值無法提供的資訊。您可以使用這項工具來預測銷售、存貨或其他的趨勢。每一個預測值都根據下列的公式計算:

計算移動平均法的公式

其中:

  • N 為移動平均所包含的先前週期數
  • Aj 為期間 j 的實際值
  • Fj 為期間 j 的預測值

顯示亂數產生器

亂數產生分析工具以經由數種分配之一求得的獨立亂數填滿範圍。您可以使用這項工具來顯示母體機率分配的特性。

例如,您可以使用常態分配來顯示母體中個別高度的特性,或使用具有兩個可能結果的二項分配來顯示投擲硬幣結果的母體特性。

顯示等級和百分比

等級與百分比分析工具可產生一份表格,裡面包含資料組中每一個數值的序數和百分比等級。您可以使用這項工具來分析資料組中數值的相對位置。此工具使用工作表中 RANK 及 PERCENTRANK 函數。RANK 並不將相同的數值計算進去,如果您想要將相同的數值計算進去,請將 RANK 工作表函數和位於 RANK 說明檔中建議的更正因素一併使用。

顯示迴歸

迴歸分析工具使用「最小平方法」執行線性迴歸分析,以畫出一條符合一組觀察資料的直線。您可以分析一個因變數是如何地被一或多個自變數所影響。

例如,您可以分析一個運動員的表現是如何地被像是年齡、身高和體重所影響。您可以根據一組成績資料來測量這三個因素分別對成績的影響,然後再使用結果來預測未測試過的新運動員成績。

迴歸工具使用工作表中的 LINEST 函數。

顯示抽樣

抽樣分析工具將輸入範圍視為母體,並使用母體來建立樣本。當母體過大而無法處理或製成圖表時,您可以使用代表樣本。如果您認為輸入資料是週期性的,也可以建立只包含某個週期特定部分數值的樣本。

例如,若輸入範圍包含了每季的銷售量,您可以在輸入範圍的同一季四個地點數值中以週期性比率來抽樣。

顯示t 檢定

常態母體 t 檢定分析工具測試每個基本樣本母體平均數的品質。這 3 項工具使用不同的假設:母體變異數為相等、母體變異數不相等及此 2 個樣本代表相同實驗對象處理前及處理後的觀察。

以下的 3 個工具中,t 統計數值會在計算後以「t Stat」顯示於表格上。依資料的不同,t 數值可以是負數或非負數。在相同母體平均數的假設之下,如果 t < 0, 「P(T <= t) 單尾」顯示將要觀察的 t 統計值的機率比 t 還小。如果 t >=0, 「P(T <= t) 單尾」表示將要觀察之 t 統計值的機率比 t 還大。「t Critical 單尾」顯示切斷的數值,所以 t 統計值的機率會大於或等於「t Critical 單尾」(Alpha)。

「P(T <= t) 雙尾」表示將要觀察之 t 統計值的機率絕對值大於 t。「P Critical 雙尾」表示切斷的值,所以 t 統計值的機率絕對值大於「P Critical 雙尾」(Alpha)。

t 檢定:兩個母體平均數差的檢定,假設變異數相等 此分析工具執行兩個樣本的 student's 式 t 檢定。這個 t 檢定形式假定兩組資料是來自相同變異數的分配,它又稱為同質性 t 檢定。您可以使用此 t 檢定來判斷兩個樣本是否來自相同母體平均數的分配。

t 檢定:兩個母體平均數差的檢定,假設變異數不相等 此分析工具執行兩個樣本的 student's 式 t 檢定。這個 t 檢定形式假定兩組資料是來自不相同變異數的分配,又稱為異質性 t 檢定。以上述變異數相等的例子,您可以使用此 t 檢定來判斷兩個樣本是否來自相等母體平均數的分配。如果兩個樣本中有不同的實驗目標,也可以使用這個檢定。如果只有一個實驗目標及兩個代表每一實驗目標的測量單位,請使用配對檢定。

下列公式用來決定統計值 t

計算統計值 t 的公式

下列公式用於計算自由度的等級 (df)。由於計算的結果通常不是整數,df 值會四捨五入到最接近的整數以取得在 t 表格中的臨界值。Excel 工作表中的 TTEST 函數,使用已計算過、未四捨五入的 df 值,因為 TTEST 可以計算非整數的 df 值。因為使用這些不同的方式來判斷自由度的等級,所以會造成 TTEST 及此 t 檢定在不相等變異數的案例中出現不同的結果。

計算自由度近似值的公式

t 檢定:成對母體平均數差異檢定 當在樣本中有自然成對的觀察時,您可以使用成對檢定。例如當檢定樣本群組 2 次 — 實驗前及實驗後。此分析工具及其公式會執行成對之 student's 式 t 檢定,以判斷處理前後所取得之觀察是否來自相等的母體平均數分配。此 t 檢定工具形式不假定兩個母體之變異數為相等。

 附註   由這個工具產生的結果為共變數,這是平均數資料分佈的累積測量值,它是由下列公式求得的。

計算共變數的公式

顯示z-檢定

z 檢定:平均數分析工具的兩個樣本執行兩個樣本的 z 檢定以求得已知變異數的平均數。這個工具是用來檢定虛無假設 (兩個母體平均數之間沒有差異),對照於另一單向或雙向的假設。如果變異數為未知,則應使用工作表中的 ZTEST 函數。

當使用 z 檢定工具時,對於所得結果應審慎了解。「P(Z <= z) 單尾」也就是 P(Z >= ABS(z)),當母體平均數相同時,z 數值的機率與觀察之 z 數值會是同方向的 (從零開始)。「P(Z <= z) 雙尾」也就是 P(Z >= ABS(z) 或 Z <= -ABS(z)),當母體平均數相同時,z 數值的機率與觀察之 z 數值會是不同方向的 (從零開始)。雙尾的結果只是單尾結果乘以 2。z 檢定工具也可以用於虛無假設中在兩個母體平均數中有特定之非零 (non-zero) 數值的例子。

例如,您可以使用這個檢定來決定兩個主模式效能之間的差異。

 
 
適用:
Excel 2003