Dùng ToolPak Phân tích để thực hiện phân tích dữ liệu phức tạp

 Quan trọng    Tính năng này không khả dụng trong Office trên máy tính RT chạy Windows. Bạn muốn xem phiên bản nào của Office mình đang dùng?

Nếu bạn muốn thực hiện các phân tích thống kê và kỹ thuật phức tạp, bạn có thể rút ngắn các bước và tiết kiệm thời gian bằng cách sử dụng ToolPak Phân tích. Bạn sẽ cung cấp dữ liệu và tham số cho từng phân tích; rồi công cụ sẽ dùng các hàm macro thống kê và kỹ thuật thích hợp rồi hiển thị kết quả trong bảng kết quả. Một số công cụ còn tạo biểu đồ ngoài bảng kết quả.

Chỉ có thể dùng các hàm phân tích dữ liệu trên từng trang tính một. Khi bạn thực hiện phân tích dữ liệu trên các trang tính đã nhóm, kết quả sẽ xuất hiện trên trang tính đầu tiên và bảng đã được định dạng trống sẽ xuất hiện trên các trang tính còn lại. Để thực hiện phân tích dữ liệu trên phần còn lại của trang tính, hãy tính lại công cụ phân tích cho từng trang tính.

ToolPak Phân tích bao gồm các công cụ được mô tả trong các phần sau. Để truy nhập các công cụ này, bấm Phân tích Dữ liệu trong nhóm Phân tích trên tab Dữ liệu. Nếu lệnh Phân tích Dữ liệu không khả dụng, bạn cần tải chương trình bổ trợ ToolPak Phân tích xuống.

Tải và kích hoạt ToolPak Phân tích

  1. Bấm tab Tệp, chọn Tùy chọn rồi bấm thể loại Bổ trợ.
  2. Trong hộp Quản lý, chọn Bổ trợ Excel, rồi bấm Đi tới.
  3. Trong hộp thoại Bổ trợ, chọn hộp kiểm tra TookPak Phân tích, rồi bấm OK.
  • Nếu ToolPak Phân tích không được liệt kê trong hộp Bổ trợ Sẵn dùng, bấm Duyệt để định vị nó.
  • Nếu bạn được nhắc rằng ToolPak Phân tích hiện chưa được cài đặt trên máy tính của bạn, hãy bấm để cài đặt nó.

Đầu Trang Đầu Trang

Bạn muốn tìm hiểu về điều gì?


Đầu Trang Đầu Trang

Anova

Công cụ phân tích Anova cung cấp các dạng phân tích phương sai khác nhau. Công cụ mà bạn nên dùng phụ thuộc vào số lượng nhân tố và số lượng mẫu mà bạn có từ các tổng thể mà bạn muốn kiểm định.

Anova: Nhân tố Đơn

Công cụ này thực hiện phân tích phương sai đơn giản trên dữ liệu cho hai hoặc nhiều mẫu. Phân tích cung cấp kiểm định cho giả thiết rằng mỗi mẫu được lấy từ cùng phân bố xác suất cơ bản so với giả thiết loại trừ rằng các phân bố xác suất cơ bản là không giống nhau đối với tất cả các mẫu. Nếu chỉ có hai mẫu, bạn có thể dùng hàm trang tính T.TEST. Với nhiều hơn hai mẫu, không có sự suy rộng T.TEST thích hợp và thay vào đó kiểu Anova Nhân tố Đơn có thể được gọi.

Anova: Nhân tố Kép có Lặp

Công cụ phân tích này hữu ích khi dữ liệu có thể được phân loại theo hai kích thước khác nhau. Ví dụ, trong một thí nghiệm để đo chiều cao của cây, các cây đó có thể được bón bằng các nhãn hiệu phân bón khác nhau (chẳng hạn A, B, C) và cũng có thể được giữ ở các nhiệt độ khác nhau (chẳng hạn thấp, cao). Với mỗi sáu cặp khả thi {phân bón, nhiệt độ}, chúng ta có số lần quan sát chiều cao của cây bằng nhau. Dùng công cụ Anova này, chúng ta có thể kiểm định:

  • Liệu chiều cao của cây đối với các nhãn hiệu phân bón khác nhau có được lấy từ cùng tổng thể cơ bản hay không. Nhiệt độ được bỏ qua trong phân tích này.
  • Liệu chiều cao của cây đối với các mức nhiệt độ khác nhau có được lấy từ cùng tổng thể cơ bản hay không. Nhãn hiệu phân bón được bỏ qua trong phân tích này.

Liệu đã tính đến tác động của những khác biệt giữa các nhãn hiệu phân bón được tìm thấy trong điểm gạch đầu dòng đầu tiên và những khác biệt về nhiệt độ được tìm thấy trong điểm gạch đầu dòng thứ hai, sáu mẫu đại diện cho tất cả các cặp giá trị {phân bón, nhiệt độ} được lấy từ cùng tổng thể hay chưa. Giả thiết loại trừ là có những tác động do các cặp {phân bón, nhiệt độ} cụ thể bên cạnh những khác biệt dựa vào riêng phân bón hoặc riêng nhiệt độ.


Thiết lập phạm vi nhập liệu cho công cụ anova


Anova: Nhân tố Kép Không Lặp

Công cụ phân tích này hữu ích khi dữ liệu được phân loại theo hai kích thước khác nhau như trong trường hợp Nhân tố Kép có Lặp. Tuy nhiên, đối với công cụ này, điều được giả định là chỉ có duy nhất một lần quan sát cho mỗi cặp (chẳng hạn, mỗi cặp {phân bón, nhiệt độ} trong ví dụ trên).

Đầu Trang Đầu Trang

Tương quan

Cả hàm trang tính CORREL và PEARSON đều tính hệ số tương quan giữa hai biến số đo lường khi quan sát các đo lường trên mỗi biến số cho mỗi trong số N đối tượng. (Bất cứ việc không quan sát đối tượng nào sẽ khiến đối tượng đó bị bỏ qua trong phân tích.) Công cụ phân tích Tương quan đặc biệt hữu ích khi có nhiều hơn hai biến số đo lường cho mỗi biến trong số N đối tượng. Nó cung cấp bảng kết quả, một ma trận tương quan, thể hiện giá trị của CORREL (hoặc PEARSON) áp dụng cho mỗi cặp biến số đo lường khả thi.

Hệ số tương quan, giống như hiệp phương sai, là đơn vị đo lường của phạm vi đến mức mà hai biến số đo lường "cùng biến đổi." Khác với hiệp phương sai, hệ số tương quan được đo sao cho giá trị của nó độc lập với các đơn vị trong đó hai biến số đo lường được thể hiện. (Ví dụ, nếu hai biến số đo lường là cân nặng và chiều cao, giá trị của hệ số tương quan không đổi nếu cân nặng được đổi từ pao sang kilogram.) Giá trị của bất cứ hệ số tương quan nào cũng phải nằm giữa khoảng -1 đến +1 bao gồm cả hai số này.

Bạn có thể dùng công cụ phân tích tương quan để kiểm tra mỗi cặp biến số đo lường để xác định liệu hai biến số đo lường có xu hướng cùng di chuyển hay không — đó là, các giá trị lớn của một biến số có xu hướng liên kết với các giá trị lớn của biến số khác hay không (tương quan dương), các giá trị nhỏ của một biến số có xu hướng liên kết với các giá trị lớn của biến số khác hay không (tương quan âm), hay các giá trị của cả hai biến số có xu hướng độc lập (tương quan gần 0 (không)).

Đầu Trang Đầu Trang

Hiệp phương sai

Công cụ Tương quan và Hiệp phương sai đều có thể được dùng trong cùng thiết đặt, khi bạn có N biến số đo lường khác nhau được quan sát trên một bộ cá thể. Công cụ Tương quan và Hiệp phương sai cung cấp bảng kết quả, một ma trận, thể hiện hệ số tương quan hoặc hiệp phương sai tương ứng giữa mỗi cặp biến số đo lường. Sự khác nhau là hệ số tương quan được đo nằm trong khoảng từ -1 đến +1 bao gồm cả hai số này. Hiệp phương sai tương ứng không được đo. Cả hệ số tương quan và hiệp phương sai đều là các đơn vị đo lường của phạm vi đến mức mà hai biến số đo lường "cùng biến đổi."

Công cụ Hiệp phương sai tính toán giá trị của hàm trang tính COVARIANCE.P cho mỗi cặp biến số đo lường. (Việc sử dụng trực tiếp COVARIANCE.P thay vì công cụ Hiệp phương sai là một biện pháp thay thế hợp lý khi chỉ có hai biến số đo lường, đó là, N=2.) Mục nhập trên phần chéo của bảng kết quả của công cụ Hiệp phương sai ở hàng i, cột i là hiệp phương sai của biến số đo lường thứ i với chính nó. Đây chỉ là hiệp phương sai tổng thể cho biến số đó, như đã được tính toán bởi hàm trang tính VAR.P.

Bạn có thể dùng công cụ Hiệp phương sai để kiểm tra mỗi cặp biến số đo lường để xác định liệu hai biến số đo lường có xu hướng cùng di chuyển hay không — đó là, các giá trị lớn của một biến số có xu hướng liên kết với các giá trị lớn của biến số khác hay không (hiệp phương sai dương), các giá trị nhỏ của một biến số có xu hướng liên kết với các giá trị lớn của biến số khác hay không (hiệp phương sai âm), hay các giá trị của cả hai biến số có xu hướng độc lập (tương quan gần 0 (không)).

Đầu Trang Đầu Trang

Thống kê Mô tả

Công cụ phân tích Thống kê Mô tả tạo ra báo cáo thống kê đơn biến cho dữ liệu trong phạm vi nhập liệu, cung cấp thông tin về xu hướng trung tâm và tính biến thiên của dữ liệu của bạn.

Đầu Trang Đầu Trang

Làm trơn Hàm mũ

Công cụ phân tích Làm trơn Hàm mũ dự đoán một giá trị phụ thuộc vào dự đoán cho kỳ trước, được điều chỉnh cho lỗi trong dự báo trướć. Công cụ dùng hằng số làm trơn a, độ lớn của nó xác định dự báo phản hồi đến các lỗi trong dự báo trước mạnh mẽ như thế nào.

 Ghi chú   Giá trị của 0,2 đến 0,3 là các hằng số làm trơn hợp lý. Các giá trị này cho biết dự báo hiện tại nên được điều chỉnh 20 phần trăm đến 30 phần trăm cho lỗi trong dự báo trước. Hằng số lớn hơn cho phản hồi nhanh hơn nhưng có thể tạo ra các phép chiếu không ổn định. Hằng số nhỏ hơn có thể khiến giá trị dự báo bị chậm trễ lâu.

Đầu Trang Đầu Trang

Hai mẫu Kiểm định F đối với Phương sai

Công cụ phân tích Hai mẫu Kiểm định F đối với Phương sai thực hiện kiểm định F đối với hai mẫu để so sánh hai phương sai tổng thể.

Ví dụ, bạn có thể dùng công cụ Kiểm định F trên các mẫu số lần gặp đội bơi đối với một trong hai đội. Công cụ cung cấp kết quả của kiểm tra giả thiết null rằng hai mẫu này đến từ các phân bố có phương sai bằng nhau, so với giải pháp loại trừ rằng phương sai không bằng nhau trong các phân bố cơ bản.

Công cụ tính giá trị f của thống kê F (hay tỉ lệ F). Giá trị f gần tới 1 cung cấp bằng chứng rằng các phương sai tổng thể cơ bản là bằng nhau. Trong bảng kết quả, nếu f < 1 "P(F <= f) một đầu" đưa ra xác suất của việc quan sát giá trị thống kê F nhỏ hơn f khi các phương sai tổng thể bằng nhau và "F Một đầu quan trọng" đưa ra giá trị giới hạn nhỏ hơn 1 cho mức độ có nghĩa được chọn, Alpha. Nếu f > 1, "P(F <= f) một đầu" đưa ra xác suất của việc quan sát giá trị thống kê F lớn hơn f khi các phương sai tổng thể bằng nhau và "F Một đầu quan trọng" đưa ra giá trị giới hạn lớn hơn 1 cho Alpha.

Đầu Trang Đầu Trang

Phân tích Fourier

Công cụ Phân tích Fourier xử lý các vấn đề trong hệ thống tuyến tính và phân tính dữ liệu định kỳ bằng cách dùng phương pháp Biến đổi Fourier Nhanh (FFT) để biến đổi dữ liệu. Công cụ này cũng hỗ trợ các biến đổi nghịch đảo, trong đó nghịch đảo của dữ liệu được biến đổi trả về dữ liệu gốc.

Phạm vi nhập liệu và kết quả cho phân tích Fourier

Đầu Trang Đầu Trang

Biểu đồ tần suất

Công cụ phân tích Biểu đồ tần suất tính toán tần suất riêng lẻ và lũy tích cho một phạm vi dữ liệu ô và tủ dữ liệu. Công cụ này tạo dữ liệu cho số lần xuất hiện của một giá trị trong tập dữ liệu.

Ví dụ, trong một lớp học có 20 học sinh, bạn có thể xác định phân bố điểm trong mục điểm theo chữ cái. Bảng biểu đồ tần suất trình bày đường biên điểm theo chữ cái và số điểm giữa biên thấp nhất và biên hiện tại. Điểm đơn có tần suất nhiều nhất là chế độ của dữ liệu.

Đầu Trang Đầu Trang

Đường Trung bình

Công cụ phân tích Trung bình Di chuyển chiếu các giá trị trong kỳ dự báo, dựa vào giá trị trung bình của biến số qua số kỳ trước cụ thể. Trung bình di chuyển cung cấp thông tin xu thế mà một đường trung bình đơn giản của tất cả các dữ liệu lịch sử sẽ được che lại. Dùng công cụ này để dự báo doanh số, hàng tồn kho hoặc các xu hướng khác. Mỗi giá trị dự báo dựa vào công thức sau.


Công thức tính trung bình di chuyển


trong đó:

  • N là số kỳ trước bao gồm trong trung bình di chuyển
  • Aj là giá trị thực tế tại thời điểm j
  • Fj là giá trị dự báo tại thời điểm j

Đầu Trang Đầu Trang

Tạo Số Ngẫu nhiên

Công cụ phân tích Tạo Số Ngẫu nhiên lấp đầy một phạm vi bằng các số ngẫu nhiên độc lập được lấy từ một trong một vài phân bố. Bạn có thể mô tả đặc điểm của các đối tượng trong tổng thể với phân bố xác suất. Ví dụ, bạn có thể dùng phân bố thường để mô tả đặc điểm tổng thể chiều cao của các cá thể, hoặc bạn có thể dùng phân bố Bernoulli của hai kết quả khả thi để mô tả đặc điểm tổng thể các kết quả ném đồng xu.

Đầu Trang Đầu Trang

Xếp hạng và Phân vị

Công cụ phân tích Xếp hạng và Phân vị tạo ra bảng có chứa xếp hạng theo số thứ tự và phần trăm của mỗi giá trị trong tập dữ liệu. Bạn có thể phân tích vị trí liên quan của các giá trị trong tập dữ liệu. Công cụ này dùng các hàm trang tính RANK.EQ và PERCENTRANK.INC. Nếu bạn muốn làm rõ các giá trị nối, dùng hàm RANK.EQ, xử lý các giá trị nối như có cùng thứ hạng, hoặc dùng hàm RANK.AVG trả xếp hạng trung bình cho các giá trị nối.

Đầu Trang Đầu Trang

Hồi quy

Công cụ phân tích Hồi quy thực hiện phân tích hồi quy tuyến tính bằng cách dùng phương pháp "bình phương tối thiểu" để khớp một đường thông qua một tập quan sát. Bạn có thể phân tích một biến số độc lập đơn bị tác động bởi các giá trị của một hoặc nhiều biến số độc lập như thế nào. Ví dụ, bạn có thể phân tích hoạt động của một vận động viên điền kinh bị ảnh hưởng bởi các yếu tố như tuổi tác, chiều cao và cân nặng như thế nào. Bạn có thể chia ra các phần trong đơn vị đo hoạt động cho mỗi trong ba yếu tố sau, dựa vào tập dữ liệu hoạt động, rồi dùng các kết quả để dự đoán hoạt động của một vận động viên mới, chưa được kiểm tra.

Công cụ Hồi quy dùng hàm trang tính LINEST.

Đầu Trang Đầu Trang

Lấy mẫu

Công cụ phân tích Lấy mẫu tạo mẫu từ tổng thể bằng cách xử lý phạm vi nhập liệu như một tổng thể. Khi tổng thể quá lớn để xử lý hay lập biểu đồ, bạn có thể dùng mẫu đại diện. Bạn cũng có thể tạo mẫu chỉ chứa các giá trị từ một phần cụ thể của một chu trình nếu bạn cho rằng dữ liệu nhập mang tính định kỳ. Ví dụ, nếu phạm vi nhập liệu chứa các số liệu doanh thu theo quý, lấy mẫu các giá trị từ cùng một quý trong phạm vi nhập liệu với tỉ lệ định kỳ của bốn địa điểm.

Đầu Trang Đầu Trang

Kiểm định t

Công cụ phân tích Kiểm định t cho Hai Mẫu kiểm tra đẳng thức của các trung bình tổng thể làm cơ sở cho mỗi mẫu. Ba công cụ dùng các giả định khác nhau: rằng các phương sai tổng thể là bằng nhau, rằng các phương sai tổng thể là không bằng nhau và rằng hai mẫu đại diện cho các quan sát trước xử lý và sau xử lý trên cùng các đối tượng.

Đối với ba công cụ dưới đây, giá trị Thống kê t, t, được tính và thể hiện là "t Stat" trong bảng kết quả. Dựa vào dữ liệu, giá trị này, t, có thể âm hoặc dương. Theo giả định của các trung bình tổng thể cơ bản bằng nhau, nếu t < 0, "P(T <= t) một đầu" đưa ra xác xuất mà một giá trị của Thống kê t sẽ được quan sát âm hơn t. Nếu t >=0, "P(T <= t) một đầu" đưa ra xác suất mà một giá trị của Thống kê t sẽ được quan sát dương hơn t. "t Một đầu quan trọng" đưa ra giá trị ngưỡng, sao cho xác suất quan sát một giá trị của Thông kê t lớn hơn hoặc bằng "t Một đầu quan trọng" là Alpha.

"P(T <= t) hai đầu" đưa ra xác suất mà một giá trị của Thống kê t sẽ được quan sát có giá trị tuyệt đối lớn hơn t. "P Hai đầu quan trọng" đưa ra giá trị ngưỡng, sao cho xác suất của Thống kê t được quan sát có giá trị tuyệt đối lớn hơn "P Hai đầu quan trọng" là Alpha.

Kiểm định t: Trung bình Hai mẫu được Lấy theo cặp

Bạn có thể dùng kiểm định theo cặp khi có sự ghép cặp tự nhiên của các quan sát trong mẫu, ví dụ như một nhóm mẫu được kiểm định hai lần  — trước và sau thử nghiệm. Công cụ phân tích này và công thức của nó thực hiện Kiểm định t của Student cho hai mẫu được lấy theo cặp để xác định các quan sát được thực hiện trước khi xử lý và các quan sát được thực hiện sau khi xử lý có khả năng đến từ các phân bố với các trung bình tổng thể bằng nhau hay không. Dạng thức Kiểm định t này không giả định rằng phương sai của cả hai tổng thể là bằng nhau.

 Ghi chú   Trong số các kết quả được tạo ra bởi công cụ này là phương sai gộp, một đơn vị đo tích lũy của dải dữ liệu về giá trị trung bình, xuất phát từ công thức sau.


Công thức tính phương sai vùng chứa


Kiểm định t: Giả định Hai mẫu có Phương sai Bằng nhau

Công cụ phân tích này thực hiện Kiểm định t của student cho hai mẫu. Dạng thức Kiểm định t này giả định rằng hai tập dữ liệu đến từ các phân bố có phương sai giống nhau. Nó được gọi là Kiểm định t phương sai có điều kiện không đổi. Bạn có thể dùng Kiểm định t này để xác định hai mẫu có khả năng đến từ các phân bố có trung bình tổng thể bằng nhau.

Kiểm định t: Giả định Hai mẫu có Phương sai Không bằng nhau

Công cụ phân tích này thực hiện Kiểm định t của student cho hai mẫu. Dạng thức Kiểm định t này giả định rằng hai tập dữ liệu đến từ các phân bố có phương sai khác nhau. Nó được gọi là Kiểm định t có phương sai phụ thuộc vào một biến ngẫu nhiên có điều kiện khác. Với trường hợp Phương sai Bằng nhau trước đó, bạn có thể dùng Kiểm định t này để xác định hai mẫu có khả năng đến từ các phân bố có trung bình tổng thể bằng nhau. Hãy dùng kiểm định này khi có các đối tượng riêng biệt trong hai mẫu. Hãy dùng kiểm định Theo cặp, được mô tả trong ví dụ sau, khi có một tập đơn các đối tượng và hai mẫu đại diện cho các đo lường cho mỗi đối tượng trước và sau xử lý.

Công thức sau được dùng để xác định giá trị thống kê t.


Công thức tính giá trị t


Công thức sau được dùng để tính bậc tự do, df. Vì kết quả của phép tính thường không là số nguyên, giá trị của df được làm tròn đến số nguyên gần nhất để có được giá trị giới hạn từ bảng t. Hàm trang tính T.TEST trong Excel dùng giá trị df được tính không làm tròn, vì nó có thể tính toán giá trị cho T.TEST bằng một df không phải số nguyên. Vì những cách tiếp cận khác nhau này đến việc xác định bậc tự do, các kết quả của T.TEST và công cụ t-Test này sẽ khác nhau trong trường hợp Phương sai Không bằng nhau.

Công thức xấp xỉ bậc tự do

Đầu Trang Đầu Trang

Kiểm định z

Kiểm định z: Công cụ phân tích Trung bình Hai mẫu thực hiện Kiểm định z hai mẫu cho trung bình với phương sai đã biết. Công cụ này được dùng để kiểm định giả thiết null rằng không có sự khác biệt giữa hai trung bình tổng thể so với các giả thiết thay thế một bên hoặc hai bên. Nếu chưa biết phương sai, hàm trang tính Z.TEST nên được dùng thay thế.

Khi bạn dùng công cụ Kiểm định z-Test, hãy thận trọng để hiểu kết quả. "P(Z <= z) một đầu" thực sự là P(Z >= ABS(z)), xác suất của một giá trị z xa hơn 0 theo cùng hướng như giá trị z được quan sát khi không có sự khác biệt giữa các trung bình tổng thể. "P(Z <= z) hai đầu" thực sự là P(Z >= ABS(z) hoặc Z <= -ABS(z)), xác suất của giá trị z xa hơn 0 theo một trong hai hướng hơn là giá trị z được quan sát khi không có sự khác biệt giữa các trung bình tổng thể. Kết quả hai đầu chỉ là kết quả một đầu nhân đôi. Công cụ Kiểm định z cũng có thể được dùng cho trường hợp trong đó giả thiết null là có giá trị khác 0 cụ thể cho sự khác biệt giữa hai trung bình tổng thể. Ví dụ, bạn có thể dùng kiểm định này để xác định sự khác biệt giữa hiệu năng của hai mẫu xe hơi.

Đầu Trang Đầu Trang

Các hàm VBA cho ToolPak Phân tích

Để bao gồm các hàm Visual Basic for Application (VBA) cho ToolPak Phân tích, bạn có thẻ tải Bổ trợ Phân tích ToolPak - VBA giống như cách bạn tải ToolPak Phân tích về. Trong hộp Bổ trợ sẵn dùng, chọn hộp kiểm tra ToolPak Phân tích- VBA.

Đầu Trang Đầu Trang

 
 
Áp dụng cho:
Excel 2013