حول أدوات التحليل الإحصائي

يوفر برنامج Microsoft Excel مجموعة من أدوات تحليل البيانات — تسمى Analysis ToolPak — يمكن استخدامها لحفظ الخطوات عندما تقوم بتطوير التحليلات الإحصائية أو الهندسية المعقدة. ويقوم المستخدم بتوفير البيانات والمعلمات لكل تحليل، وتستخدم الأداة دالات ماكرو الإحصائية أو الهندسية المناسبة ثم تعرض النتائج في جدول الإخراج. تنشئ بعض الأدوات مخططات بالإضافة إلى جداول الإخراج.

دالات ورقة العمل المرتبطة يوفر Excel العديد من دالات ورقة العمل الإحصائية والمالية والهندسية الأخرى. وتكون بعض الدالات الإحصائية مضمنة بينما يصبح البعض الآخر متوفرًا عندما تقوم بتثبيت Analysis ToolPak.

الوصول إلى أدوات تحليل البيانات تتضمن Analysis ToolPak الأدوات الموصوفة أدناه. للوصول إلى هذه الأدوات، انقر فوق Data Analysis (تحليل البيانات) من القائمة أدوات. إذا كان الأمر Data Analysis (تحليل البيانات) غير متوفر، فأنت بحاجة إلى تحميل برنامج الوظائف الإضافية (وظيفة إضافية: برنامج إضافي يضيف أوامر أو ميزات مخصصة إلى Microsoft Office.) Analysis ToolPak.

إظهارAnova

توفر أدوات تحليل Anova أنواعًا مختلفة من تحليل التباين. وتعتمد الأداة التي يتعين عليك استخدامها على عدد من العوامل والعينات المتوفرة لديك من المحتوى الذي تريد اختباره.

Anova: Single Factor تجري هذه الأداة تحليلاً بسيطًا للتباين على البيانات لعينتين أو أكثر - حيث يوفر التحليل اختبارًا على فرض أنه قد تم سحب كل عينة من نفس التوزيع الاحتمالي الأساسي فى مقابل الافتراض البديل أن التوزيعات الاحتمالية الأساسية تختلف من عينة لأخرى. فإذا كانت هناك عينتان فقط، يمكنك استخدام دالة ورقة العمل TTEST. أما إذا كان لديك أكثر من عينتين, فلا يوجد تعميم مناسب لـ TTEST، ويمكن استدعاء نموذج Single Factor Anova بدلاً منه.

Anova: Two-Factor With Replication تكون أداة التحليل هذه مفيدة عندما يمكن تصنيف البيانات من خلال بعدين مختلفين. فعلى سبيل المثال، في تجربة لقياس طول النباتات، قد تخصب النباتات بأنواع مختلفة من السماد (على سبيل المثال أ، ب، ج) وربما توضع أيضًا فى درجات حرارة مختلفة (على سبيل المثال درجات حرارة منخفضة وعالية). لكل من الأزواج الستة المحتملة من {السماد، درجة الحرارة}، يكون لدينا عدد متساوٍ من الملاحظات على طول النباتات. وباستخدام أداة Anova يمكننا اختبار:

  1. ما إذا كان طول النباتات بالنسبة لأنواع السماد المختلفة مأخوذة من نفس المحتوى الأساسي أم لا؛ ويتم تجاهل درجات الحرارة لهذا التحليل.
  2. ما إذا كان طول النباتات بالنسبة لدرجات الحرارة المختلفة مأخوذة من نفس المحتوى الأساسي أم لا؛ ويتم تجاهل أنواع الأسمدة لهذا التحليل.
  3. سواء قامت العينات الست بحساب التأثيرات الناتجة عن الاختلافات بين أنواع السماد الموجودة فى الخطوة 1 والاختلافات فى درجة الحرارة الموجودة فى الخطوة 2 أم لا، فيتم سحب هذه العينات الست التى تمثل كافة أزواج القيم {السماد، درجة الحرارة} من نفس المحتوى. وينص الافتراض التبادلي على أن هناك تأثيرات نتيجة زوج معين من {السماد، درجة الحرارة} بالإضافة إلى الاختلافات التي تستند إلى نوع السماد فقط أو درجة الحرارة فقط.

إعداد نطاق الإدخال لأداة anova

Anova: Two-Factor Without Replication تكون أداة التحليل هذه مفيدة عندما تصنف البيانات ضمن بعدين مختلفين مثلما هو الحال فى Two-Factor case With Replication. لكن بالنسبة لهذه الأداة، فمن المفترض أن تكون هناك ملاحظة واحدة لكل زوج (على سبيل المثال، كل زوج من {السماد، درجة الحرارة} في المثال السابق.) باستخدام هذه الأداة يمكننا تطبيق الاختبارات الموجودة في الخطوتين 1 و2 مع حالة Anova: Two-Factor With Replication ولكن لا يكون لدينا بيانات كافية لتطبيق الاختبار في الخطوة 3.

إظهارCorrelation (الارتباط)

تحسب كل من دالتي ورقة العمل CORREL وPEARSON معامل الارتباط بين متغيرين من متغيرات القياس عند ملاحظة قياسات كل متغير بالنسبة لكل عدد من المباحث. (تتسبب أية ملاحظة مفقودة لأي مبحث فى تجاهل ذلك المبحث فى التحليل). وتكون أداة التحليل Correlation مفيدة على وجه الخصوص إذا كان هناك أكثر من متغيرين للقياس لكل عدد من المباحث. حيث توفر جدول إخراج عبارة عن مصفوفة ارتباط تظهر قيمة CORREL (أو PEARSON) المطبقة على كل زوج محتمل من متغيرات القياس.

إن معامل الارتباط، مثل التباين المشترك، هو وحدة قياس للنطاق الذي يتنوع فيه متغيران للقياس معًا. بعكس التباين المشترك، فإنه يتم قياس معامل الارتباط، بحيث لا تعتمد قيمته على الوحدات التي تم التعبير بها عن متغيري القياس. (فعلى سبيل المثال، إذا كان متغيرا القياس هما الوزن والطول، لا يمكن تغيير قيمة معامل الارتباط إذا تحولت وحدة قياس الوزن من الرطل إلى الكيلوجرام.) ويجب أن تتراوح قيمة أي معامل ارتباط بين -1 و+1 متضمنة القيمتين.

يمكنك استخدام أداة تحليل الارتباط لاختبار كل زوج من متغيرات القياس لتحديد ما إذا كان متغيرا القياس سيتحركان معًا أم لا، ويعني هذا إما أن تتجه القيم الكبيرة لمتغير واحد إلى الاقتران بالقيم الكبيرة لمتغير آخر (الارتباط الإيجابي) وإما تتجه القيم الصغيرة لمتغير واحد إلى الاقتران بالقيم الكبيرة لمتغير آخر (الارتباط السلبي) أو تتجه قيم كلا المتغيرين إلى عدم الارتباط (تقترب نسبة الارتباط من 0 (الصفر)).

إظهارCovariance (التباين المشترك)

يمكن استخدام كل من الأداتين Correlation (الارتباط) والتباين المشترك (Covariance) في نفس الإعداد، عند ملاحظة عدد من متغيرات قياس مختلفة على مجموعة من العناصر المفردة. تعطي كلٌ من الأداتين الارتباط والتباين المشترك جدول إخراج عبارة عن مصفوفة تظهر معامل الارتباط أو التباين المشترك على التوالي بين كل زوج من متغيرات القياس. ويكون الاختلاف في أنه يتم قياس معاملات الارتباط لتتراوح بين -1 و+1 متضمنة القيمتين. لكن لن يتم قياس التباينات المشتركة المناظرة. يعتبر كل من معامل الارتباط والتباين المشترك من مقاييس النطاق الذي يتباين فيه المتغيران معًا.

تحسب أداة التباين المشترك قيمة دالة ورقة العمل COVAR لكل زوج من متغيرات القياس. (يعتبر الاستخدام المباشر لـ COVAR بدلاً من أداة التباين المشترك بديلاً معقولاً إذا كان هناك متغيران للقياس فقط، وهما N=2). ويعتبر الإدخال على قطر جدول إخراج أداة التباين المشترك في الصف i والعمود i التباين المشترك لمتغير القياس i مع نفسه. وهذا مجرد تنوع المحتوى لهذا المتغير كما تم حسابه بدالة ورقة العمل VARP.

يمكنك استخدام أداة التباين المشترك لفحص كل زوج من متغيرات القياس وذلك لتحديد ما إذا كان متغيرا القياس سيتحركان معًا أم لا- ويعني هذا إما أن تتجه القيم الكبيرة لمتغير واحد إلى الاقتران بالقيم الكبيرة (لتباين مشترك إيجابى) آخر، وإما تتجه القيم الصغيرة لمتغير واحد إلى الاقتران بالقيم الكبيرة (لتباين مشترك سلبي) آخر أو تتجه قيم كلا المتغيرين إلى عدم الارتباط (تقترب نسبة التباين المشترك من 0 (الصفر)).

إظهارDescriptive Statistics (إحصائيات وصفية)

تقدم أداة التحليل إحصائيات وصفية تقريرًا عن الإحصائيات متوحدة التباين للبيانات الموجودة في نطاق الإدخال، مع توفر معلومات حول الاتجاه المركزي للبيانات وتباينها.

إظهارExponential Smoothing (الانسيابية الأسية)

تتنبأ أداة التحليل الانسيابية الأسية بقيمة تستند إلى تنبؤ الفترة السابقة، مع ضبط الأخطاء الموجودة فى ذلك التنبؤ السابق. كما تستخدم الأداة الثابت الانسيابي أ، الذي يحدد حجمه قوة استجابة التنبؤات لأخطاء التنبؤ السابق.

 ملاحظة   تعتبر القيم 0.2 إلى 0.3 ثوابت انسيابية معقولة. وتشير هذه القيم إلى أنه يتعين ضبط التنبؤ الحالي بنسبة 20% إلى 30% للأخطاء الموجودة في التنبؤ السابق. وتحقق الثوابت الأكبر حجمًا استجابة أسرع لكنها تنتج توقعات غريبة. من الممكن أن ينتج عن الثوابت الأقل حجمًا مدد انتقالية طويلة لقيم التنبؤ.

إظهارF-Test Two-Sample for Variances

تقوم أداة التحليل F-Test Two-Sample for Variances (اختبار F لعينتين للتباينات) بـ F-test (اختبارF) لعينتين للمقارنة بين تباينين للمحتوى.

فعلى سبيل المثال، يمكنك استخدام أداة اختبار F على عينات من الوقت في سباق للسباحة لكل من الفريقين. حيث توفر الأداة نتيجة اختبار الافتراض الخالي أنه تم أخذ هاتين العينتين من توزيعات ذات تباينات متساوية، مقابل البديل أن التباينات ليست متساوية في التوزيعات الأساسية.

تحسب الأداة القيمة f F-statistic (لإحصاء F) (أو F-ratio (نسبة F)). وتقدم قيمة f التي تقترب من 1 دليلاً على تساوي تباينات المحتوى الأساسي. ففي جدول الإخراج، إذا كان f < 1 “P(F <= f) one-tail” يعطي احتمالاً لملاحظة قيمة في F-statistic (الإحصاء F) أقل من f عند تساوي تباينات المحتوى وتعطي "F Critical one-tail" القيمة الحرجة لأقل من 1 لمستوى الدلالة Alpha الذي تم اختياره. فإذا أعطى f > 1, “P(F <= f) one-tail” احتمالية ملاحظة قيمة F-statistic (إحصاء F) الأكبر من f عند تساوي تباينات المحتوى، ويعطي "F Critical one-tail" القيمة الحرجة أكبر من 1 لـ Alpha.

إظهارFourier Analysis (تحليل Fourier)

تحل الأداة Fourier Analysis (تحليل Fourier) المشاكل الموجودة في الأنظمة الخطية وتحلل البيانات الدورية باستخدام طريقة Fast Fourier Transform (FFT) في تحويل البيانات. وتدعم هذه الأداة أيضًا التحولات العكسية، التي تقوم البيانات المحولة فيها بإرجاع البيانات الأصلية.

نطاق الإدخال والإخراج لتحليل Fourier

إظهارHistogram

تحسب أداة التحليل Histogram (المدرج التكراري) الترددات الفردية والتراكمية لنطاق البيانات لخلية وحاويات البيانات. كما تنشئ هذه الأداة بيانات بعدد تكرارات القيمة في مجموعة بيانات.

فعلى سبيل المثال، في فصل يتكون من 20 تلميذًا، يمكنك تحديد توزيع النقاط في فئات حسب تقديرهم. ويقدم جدول المدرج التكراري الحدود لكل تقدير وعدد النقاط بين الحد الأدنى والحد الحالي لكل تقدير. وتكون النقطة الوحيدة التي تتكرر بكثرة هي وضع البيانات.

إظهارMoving Average

تصور أداة التحليل Moving Average (معدل النقل) القيم في فترة التنبؤ، استنادًا إلى معدل قيمة المتغير عبر عدد معين من الفترات السابقة. ويوفر معدل النقل معلومات الاتجاه والتي يمكن أن يخفيها المعدل البسيط لكافة البيانات التاريخية. ويمكنك استخدام هذه الأداة في التنبؤ بالمبيعات أو المخزون أو اتجاهات أخرى. وتستند كل قيمة للتنبؤ إلى الصيغة التالية.

صيغة حساب معدلات النقل

حيث:

  • N هو عدد الفترات الزمنية السابقة التي سيتم تضمينها في معدل النقل
  • Aj هى القيمة الفعلية في الوقت j
  • Fj هي قيمة التنبؤ في الوقت j

إظهارRandom Number Generation

تقوم أداة التحليل Random Number Generation (إنشاء الرقم العشوائي) بتعبئة نطاق بالأرقام العشوائية المستقلة المأخوذة من واحد من توزيعات متعددة. ويمكنك تمييز المباحث في أى محتوى بتوزيع الاحتمال.

فعلى سبيل المثال، يمكنك استخدام توزيع عادي لتمييز محتوى طول الأفراد أو يمكنك استخدام توزيع Bernoulli لنتيجتين محتملتين لتمييز محتوى النتائج العشوائية.

إظهارRank and Percentile (الرتبة والقيمة المئوية)

تنتج أداة التحليل Rank and Percentile (الرتبة والقيمة المئوية) جدولاً يتضمن الرتبة والنسبة المئوية لكل قيمة من مجموعة البيانات. ويمكنك تحليل قيم الحالات النسبية في مجموعة بيانات. تستخدم هذه الأداة دالتي ورقة العمل RANK وPERCENTRANK. لا تقوم RANK بحساب القيم المرتبطة. لكن إذا أردت حساب القيم المرتبطة، فيمكنك استخدام دالة ورقة العمل RANK مع عامل التصحيح المقترح في الملف "تعليمات" الخاص بـ RANK.

إظهارRegression (الانحدار)

تقوم أداة التحليل Regression (الانحدار) بتحليل الانحدار الخطي باستخدام الأسلوب "least squares" ("المربعات الصغرى") لاحتواء خط عبر مجموعة من الملاحظات. ويمكنك تحليل مدى تأثر متغير تابع مفرد بقيم متغير واحد غير تابع أو أكثر.

فعلى سبيل المثال، يمكنك تحليل مدى تأثير أداء شخص رياضي بعوامل أخرى مثل عامل السن والطول والوزن. كما يمكن تقسيم الأنصبة في قياس الأداء لكل واحد من العوامل الثلاثة، استنادًا إلى مجموعة من بيانات الأداء، ثم استخدم النتائج في التنبؤ بأداء شخص رياضي جديد لم يتم اختباره.

تستخدم أداة الانحدار دالة ورقة العمل LINEST.

إظهارSampling (أخذ العينات)

تنشئ أداة التحليل Sampling (أخذ العينات) عينة من المحتوى بالتعامل مع نطاق الإدخال كمحتوى. فعندما يكون المحتوى كبيرًا جدًا بحيث يصعب معالجته أو عمل تخطيط له, يمكنك استخدام عينة تمثيلية. ويمكنك أيضًا إنشاء عينة تحتوي فقط على القيم المأخوذة من جانب خاص من دورة إذا ما كنت تعتقد أن بيانات الإدخال دورية.

فعلى سبيل المثال، إذا احتوى نطاق الإدخال على أرقام مبيعات ربع سنوية، يحل أخذ العينات ذو المعدل الدوري البالغ أربعة محل القيم من نفس الربع في نطاق الإخراج.

إظهارt-Test (الاختبار t)

تختبر أدوات التحليل Two-Sample t-Test (الاختبار t لعينتين) تساوي أوساط المحتوى الأساسي لكل عينة. وتوظف الأدوات الثلاث افتراضات مختلفة: تساوي تباينات المحتوى، وعدم تساوي تباينات المحتوى وأن كلتا العينتين تمثلان ملاحظات قبل المعاملة وبعدها على نفس المباحث.

بالنسبة إلى كافة الأدوات الثلاث أدناه، يتم حساب قيمة الإحصاء t وتظهر على الشكل "t Stat" في جداول الإخراج. واستنادًا إلى هذه البيانات، من الممكن أن تكون هذه القيمة، t، سالبة أو غير سالبة. ومن خلال افتراض تساوي أوساط المحتوى الأساسي، إذا أعطى t < 0, “P(T <= t) one-tail” احتمالاً أنه سيتم ملاحظة أن قيمة الإحصاء t أكثر سلبية من t. وإذا أعطى t >=0, “P(T <= t) one-tail” احتمالاً أنه سيتم ملاحظة أن قيمة الإحصاء t هو أكثر إيجابية من t. تعطي “t Critical one-tail” القيمة المختصرة وبذلك، تكون احتمالية ملاحظة قيمة الإحصاء t الأكبر من أو تساوي “t Critical one-tail” هي Alpha.

تعطي “P(T <= t) two-tail” احتمالاً أنه سيتم ملاحظة قيمة الإحصاء t الأكبر في القيمة المطلقة من t. وتعطي “P Critical two-tail” القيمة المختصرة، وبذلك تكون احتمالية الإحصاء t الملاحظة الأكبر في القيمة المطلقة من “P Critical two-tail” هي Alpha.

t-Test: Two-Sample Assuming Equal Variances تقوم أداة التحليل هذه باختبار two-sample Student's t-Test. ويفترض نموذج t-Test (اختبار t) أنه تم أخذ مجموعتين من البيانات من التوزيعات ذات تباينات متساوية. ويشار إليها باعتبارها t-Test (الاختبار t) ذا التباين المتساوي. ويمكنك استخدام t-Test لتحديد ما إذا كان من المحتمل أن تكون العينتان مأخوذتين من نفس التوزيعات ذات أوساط محتوى متساوية.

t-Test: Two-Sample Assuming Unequal Variances تقوم أداة التحليل هذه باختبار two-sample student's t-Test. ويفترض نموذج t-Test (الاختبار t) أن كلتا المجموعتين من البيانات مأخوذتان من توزيعات ذات تباينات غير متساوية. ويشار إليها كاختبار t ذي تباين غير متساوٍ. ومثل حالة "التباينات المتساوية" (Equal Variances) السابقة، يمكنك استخدام الاختبار t لتحديد ما إذا كان من المحتمل أن تكون كلتا العينتين مأخوذتين من توزيعات ذات أوساط محتوى متساوية أم لا. ويمكنك استخدام هذا الاختبار في حالة وجود مباحث مميزة في كلتا العينتين. كما يمكن استخدام الاختبار الزوجي الموضح في المثال التالي في حالة وجود مجموعة واحدة من المباحث وعينتين تمثلان مقاييس كل مبحث قبل المعاملة وبعدها.

تستخدم الصيغة التالية في تحديد قيمة الإحصاء t.

صيغة حساب القيمة t

تستخدم الصيغة التالية في حساب درجات الحرية، df. وحيث إنه غالبًا لا يكون ناتج الحساب عددًا صحيحًا، يتم تقريب قيمة df إلى أقرب عدد صحيح للحصول على قيمة حرجة من الجدول t. تستخدم دالة ورقة عمل Excel، TTEST، قيمة df المحسوبة دون تقريب، لأن من المحتمل أن تحسب قيمة TTEST بعدد df غير صحيح. ونتيجة لهذه الطرق المختلفة لتحديد درجات الحرية، ستختلف نتائج TTEST وأداة t-Test في حالة التباينات غير المتساوية.

صيغة تقريب درجات الحرية

t-Test: Paired Two Sample For Means يمكنك استخدام اختبار زوجي عند وجود زوج طبيعي من الملاحظات في العينات، كما هو الحال عند اختبار مجموعة كعينة مرتين — قبل التجربة وبعدها. وتقوم أداة التحليل هذه وصيغتها باختبار paired two-sample Student's t-Test لتحديد ما إذا كانت الملاحظات التي تم أخذها قبل المعاملة والتي تم أخذها بعد المعاملة من المحتمل أن تكون نابعة من توزيعات ذات أوساط محتوى متساوية. ولا يفترض نموذج اختبار t تساوي تباينات كلا المحتويين.

 ملاحظة   يأتي التباين المجمع ضمن النتائج التي تنشئها هذه الأداة، وهو إجراء تراكمي لنشر بيانات حول الوسط الذي تم اشتقاقه من الصيغة التالية.

صيغة حساب التباين المجمع

إظهارz-Test (الاختبار z)

الاختبار z: تقوم أداة التحليل عينتان للوسائط (Two Sample for Means ) باختبار z ذي العينتين لأوساط ذات تباينات معروفة. وتستخدم هذه الأداة في اختبار الافتراض الخالي أنه ليس هناك اختلاف بين وسيطي المحتوى مقابل افتراضات بديلة أحادية الجانب أو ثنائية الجانب. وإذا كانت التباينات غير معروفة، يتعين استخدام دالة ورقة العمل ZTEST بدلاً منها.

عند استخدام الأداة z-Test كن حريصًا على فهم الإخراج. إن “P(Z <= z) one-tail” هو في الحقيقة P(Z >= ABS(z))، وهي احتمالية إبعاد القيمة z عن الصفر في نفس الاتجاه مثل قيمة z التي تمت ملاحظتها، في حالة عدم وجود اختلاف بين أوساط المحتوى. إن “P(Z <= z) two-tail” في الحقيقة هو P(Z >= ABS(z) or Z <= -ABS(z))، وهو أن هناك احتمال إبعاد قيمة z عن الصفر في أى اتجاه عن قيمة z التي تمت ملاحظتها في حالة عدم وجود اختلاف بين أوساط المحتوى. إن النتيجة ثنائية الأطراف ما هي إلا نتيجة أحادية الأطراف مضروبة في 2. ويمكن أيضًا استخدام الأداة z-Test في حالة وجود افتراض خالٍ أن هناك قيمة غير صفرية معينة للاختلاف بين وسطي المحتوى.

فعلى سبيل المثال، يمكنك استخدام هذا الاختبار لتحديد الاختلافات بين أداء طرازين من السيارات.

 
 
يطبق على:
Excel 2003