Извършване на статистически и инженерен анализ с Analysis ToolPak

Ако се нуждаете от разработване на сложни статистически или инженерни анализи, можете да спестите стъпки и време с помощта на Analysis ToolPak. Вие предоставяте данните и параметрите, а инструментът използва подходящи статистически и инженерни функции на макроси, за да изчисли и покаже резултатите в изходната таблица. Някои инструменти генерират диаграми в допълнение към изходните таблици.

Analysis ToolPak включва инструментите, описани по-долу. За да получите достъп до тези инструменти, щракнете върху Анализ на данни в групата Анализ на раздела Данни. Ако командата Анализ на данни не е налична, трябва да заредите допълнителната програма Analysis ToolPak.

ПокажиЗареждане на Analysis ToolPak

  1. Щракнете върху бутона Microsoft Office Изображение на бутон и след това изберете Опции на Excel.
  1. Щракнете върху Добавки и след това в полето Управление изберете Добавки на Excel.
  2. Щракнете върху Почни.
  3. В полето Налични добавки отметнете квадратчето Analysis ToolPak и след това щракнете върху OK.

Съвет    Ако Analysis ToolPak не е показан в полето Налични добавки, щракнете върху Преглед, за да го откриете.

Ако се появи подсещащо съобщение за това, че Analysis ToolPak не е инсталиран на компютъра, щракнете върху Да, за да го инсталирате.

 Забележка   За да включите функции на Visual Basic for Applications (VBA) за Analysis ToolPak, можете да заредите VBA добавката за него по същия начин. В полето Налични добавки отметнете квадратчето Analysis ToolPak – VBA.

За описание на всеки един инструмент, щракнете върху името на инструмента в следния списък.

ПокажиAnova

Инструментите за анализ на Anova предоставят различни типове за дисперсионен анализ. Инструментът, който трябва да използвате, зависи от броя на факторите и от броя на образците (пробите), които имате от генералните съвкупности, които искате да проверите.

Anova: Еднофакторен

Този инструмент извършва прост дисперсионен анализ на данни за две или повече проби. Анализът предоставя проверка на хипотезата, че всеки образец е изтеглен с едно и също основно разпределение на вероятностите, срещу алтернативната хипотеза, че подразбиращите се разпределения на вероятностите не са едни и същи за всички образци. Ако има само две проби, можете да използвате функцията на работен лист TTEST. За повече от две проби няма подходящо обобщение на TTEST и вместо това може да се извика моделът "Еднофакторен" на "Anova".

Anova: Двуфакторен с репликация

Този инструмент за анализ е полезен, когато данните могат да се класифицират по две различни измерения. Например в един експеримент за измерване на височината на растения, на растенията могат да са предоставени различни видове тор (например A, B, C) и може също така да се пазят при различни температури (например ниска и висока). За всяка от шестте възможни двойки {тор, температура} имаме еднакъв брой наблюдения за височината на растенията. Използвайки този инструмент на Anova, можем да проверим:

  • Дали височините на растенията за различните марки торове се получава от една и съща основна генерална съвкупност. При този анализ температурите се игнорират.
  • Дали височините на растенията за различните температури се извличат от една и съща основна популация. Видовете торове се игнорират за този анализ.

Дали, отчитайки последиците от разликите в марките тор, намерени в първата точка, и от различните температури, намерени във втората точка, шестте проби, представящи всички двойки {тор, температура}, са изтеглени от една и съща генерална съвкупност. Алтернативната хипотеза е, че има последици, които се дължат на спецификата на двойките {тор, температура}, надхвърлящи разликите, базиращи се на въздействията на вида тор и температурата, взети поотделно.


Настройка на входния диапазон за инструмент на Аnova


Anova: Двуфакторен без репликация

Този инструмент за анализ е полезен, когато данните са класифицирани по две различни размерности като двуфакторния случай с репликация. Обаче за този инструмент се приема, че има само единични наблюдения за всяка двойка (например всяка двойка {тор, температура} в предишния пример).

ПокажиКорелация

И двете функциите за работен лист CORREL и PEARSON изчисляват коефициентите на корелацията между две променливи на измервания, когато се наблюдават измерванията на всяка променлива за N обекта. (Всяко пропускане на наблюдение за кой да е обект води до игнорирането на обекта в анализа.) Инструментът за корелационен анализ е особено полезен, когато има повече от две променливи на измервания за всеки един от дадените N обекта. Той предоставя изходна таблица, една матрица на корелациите, която показва стойността на CORREL (или PEARSON), приложена към всяка възможна двойка на променливи на измервания.

Коефициентът на корелация, подобен на ковариацията, е мярка на степента, с която променливите на измерванията "се променят заедно". За разлика от ковариацията, коефициентът на корелация е мащабиран, така че неговата стойност е независима от единиците с които са изразени двете променливи на измерванията. (Например ако двете променливи на измервания са тегло и височина, стойността на коефициента на корелация остава непроменена, ако теглото се преобразува от фунтове в килограми.) Стойността на всеки коефициент на корелация трябва да е между -1 и +1, включително.

Можете да използвате инструмента за корелационен анализ, за да изследвате всяка двойка променливи на измервания, за да определите дали двете променливи на измервания имат тенденция да се променят едновременно – тоест дали големите стойности на едната променлива имат склонност да са свързани с големи стойности на другата (положителна корелация), или малките стойности на едната променлива имат склонност да са свързани с големи стойности на другата (отрицателна корелация), и дали стойностите на двете променливи имат склонност да не са свързани (корелация, близка до 0 (нула)).

ПокажиКовариация

И двата инструмента за корелация и ковариация могат да се използват с еднаква настройка, когато имате N различни променливи на измервания, наблюдавани за набор от индивиди. Всеки един от инструментите за корелация и ковариация дава изходна таблица – една матрица, която показва съответно коефициента на корелация или ковариация, между всяка двойка променливи на измерване. Разликата е в това, че коефициентите на корелация са мащабирани да лежат в интервала между -1 и +1, включително. Съответните ковариации не са мащабирани. И коефициентът на корелация, и коефициентът на ковариация са мерки на степента, в която две променливи "се променят съвместно".

Инструментът за ковариация изчислява стойността на функцията на работен лист COVAR за всяка двойка променливи на измервания. (Непосредственото използване на COVAR вместо инструмента за ковариация е приемлива алтернатива, когато има само две променливи на измервания, тоест, N=2.) Записът по диагонала на изхода на инструмента за ковариация в ред i, колона i е ковариацията на i-тата променлива на измерване със себе си. Това е точно вариацията на генералната съвкупност за тази променлива, както е изчислена от функцията на работен лист VARP.

Можете да използвате инструмента за ковариация, за да изследвате всяка двойка променливи на измервания, за да определите дали двете променливи на измервания имат тенденция да се променят едновременно – тоест дали големите стойности на едната променлива имат склонност да са свързани с големи стойности на другата (положителна ковариация), или малките стойности на едната променлива имат склонност да са свързани с големи стойности на другата (отрицателна ковариация), и дали стойностите на двете променливи имат склонност да не са свързани (ковариация, близка до 0 (нула)).

ПокажиОписателни статистики

Инструментът за анализ на описателни статистики генерира отчет на едновременно променящи се статистики за данни във входния диапазон, предоставяйки информация за основната тенденция на вашите данни.

ПокажиЕкспоненциално изглаждане

Инструментът за анализ на експоненциално изглаждане предсказва стойност, която е базирана на прогнозата за предишния период, регулирана за грешката в тази предишна прогноза. Инструментът използва константата на изглаждане a, големината на която определя колко точно прогнозите отговарят на грешката в по-раншната прогноза.

 Забележка   Стойности от 0,2 до 0,3 са приемливи константи на изглаждане. Тези стойности означават, че текущата прогноза трябва да бъде настроена с грешка от 20 до 30 процента за по-раншната прогноза. По-големи константи водят до по-бърз отговор, но могат да породят погрешни преценки. По-малки константи могат да предизвикат дълги забавяния за прогнозните стойности.

ПокажиF-тест на две проби за дисперсии

Инструментът за F-тест на две проби за дисперсии извършва F-тест за две проби, за да сравни две дисперсии на генерални съвкупности.

Например можете да използвате инструмента за F-тест за образци на времена в състезание по плуване за два отбора. Инструментът предоставя резултата от тест при невалидното предположение, че тези две проби произхождат от разпределения с равни дисперсии, срещу алтернативата, че дисперсиите не са равни в подразбиращите се разпределения.

Инструментът изчислява стойността f на F-статистика (или F-пропорция). Стойност на f, близка до 1, предоставя доказателство на факта, че подразбиращите се дисперсии са равни. В изходната таблица, ако f < 1 "P(F <= f) едностранно" дава вероятността за наблюдаване на стойност на F-статистиката, която да е по-малка от f, когато дисперсиите на генералните съвкупности са равни, а "F критично едностранно" дава критичната стойност, по-малка от 1, за избраното ниво на значимост Алфа. Ако f > 1, "P(F <= f) едностранно" дава вероятността за наблюдаване на стойност на F-статистиката, по-голяма от f, когато дисперсиите на генералната съвкупност са равни, а "F критично едностранно" дава критичната стойност, по-голяма от 1, за Алфа.

ПокажиФурие анализ

Инструментът за Фурие анализ решава проблеми в линейни системи и анализира периодични данни с помощта метода на бързото преобразование на Фурие (FFT) за преобразуване на данни. Този инструмент поддържа също обратни преобразувания, в които обратните на преобразуваните данни отговарят на първоначалните данни.


Входни и изходни диапазони за Фурие анализ


ПокажиХистограма

Инструментът за анализ на хистограми изчислява отделни и кумулативни честоти за диапазон от клетки за данни и обединения. Този инструмент генерира данни за броя на повторенията на стойност в набор от данни.

Например в клас от 20 студенти можете да определите разпределението на точките в побуквено класирани категории. Таблицата на хистограмата представя побуквено класираните граници и броя на точките между най-ниската граница и текущата граница. Единственият най-често срещан брой точки е модата на данните.

ПокажиПодвижна средна стойност

Инструментът за анализ на подвижна средна стойност планира стойности в прогнозния период, базирани на средната стойност на променливата за определен брой предшестващи периоди. Подвижната средна стойност предоставя информация за тенденцията, която простата средна стойност на всички хронологични данни би маскирала. Използвайте този инструмент, за да прогнозиране на продажби, запаси или други тенденции. Всяка прогнозна стойност се базира на следната формула.


Формула за изчисляване на подвижни средни стойности


където:

  • N е броят на предишните периоди, които да се включат в подвижната средна стойност
  • Aj е действителната стойност в момента j
  • Fj е прогнозираната стойност за момента j

ПокажиГенериране на случайни числа

Инструментът за анализ на генерация на случайни числа попълва диапазон с независими случайни числа, които се изтеглят от едно или няколко разпределения. Можете да характеризирате обектите в генералната съвкупност заедно с разпределение на вероятностите. Например можете да използвате нормално разпределение, за да характеризирате генералната съвкупност от височини на индивиди или пък можете да използвате разпределение на Бернули за два възможни изхода, за да характеризирате генералната съвкупност на резултати от хвърляне на монета.

ПокажиРанг и процентил

Инструментът за анализ на ранг и процентил показва таблица, която съдържа ординалния и процентен ранг на всяка стойност в набор данни. Можете да анализирате относителното положение на стойности в набор от данни. Този инструмент използва функциите на работен лист RANK и PERCENTRANK. RANK не отчита свързани данни. Ако искате да отчитате свързани данни, използвайте функцията на работен лист RANK заедно с коефициента за поправка, което се предлага във файла на помощта за RANK.

ПокажиРегресия

Инструментът за регресионен анализ извършва линеен регресионен анализ с помощта на метода на "май-малките квадрати", за да нагоди линия през набор от наблюдения. Можете да анализирате как единична зависима променлива се влияе от стойностите на една или няколко независими променливи. Например можете да анализирате как се влияят постиженията на атлетите от такива фактори като възраст, височина и тегло. Можете да разпределите дялове в измерването на постижението за всеки от тези фактори, базирани на данните за постижението, и след това да използвате резултатите, за да предскажете постижението на нов, неизпробван атлет.

Инструментът за регресия използва функцията на работен лист LINEST.

ПокажиВземане на образци

Инструментът за анализ на вземане на образци създава образец от генерална съвкупност чрез третирането на входния диапазон като генерална съвкупност. Когато генералната съвкупност е твърде голяма за обработка или начертаване, можете да използвате представителен образец. Можете също да създадете образец, който съдържа само стойностите от конкретна част на серия, ако предполагате, че входните данни са периодични. Например ако входният диапазон съдържа суми за тримесечни продажби, периодичното вземане на образци с период четири поставя стойностите от едно и също тримесечие в изходната таблица.

Покажиt-тест

Инструментите за анализ на t-тест с две проби тестват за равенство на средни стойности на генералните съвкупности, които са в основата на всеки образец. Трите инструмента използват различни допускания: че дисперсиите на генералните съвкупности са равни, че дисперсиите на генералните съвкупности не са равни и че двете проби представляват наблюдения преди и след обработката на едни и същи обекти.

За всичките три инструмента по-долу, стойността на t-статистиката t се пресмята и показва като "t Stat" в изходните таблици. В зависимост от данните, тази стойност t може да бъде отрицателна или неотрицателна. При предположение за равенство на средните стойности на стоящите в основата генерални съвкупности, ако t < 0, "P(T <= t) едностранно" дава вероятността, че стойността на t-статистиката би била наблюдавана като по-отрицателна от t. Ако t >=0, "P(T <= t) едностранно" дава вероятността стойността на t-статистиката да се наблюдава като по-положителна от t. "t критично едностранно" дава отрязаната стойност, така че вероятността за наблюдаване на стойността на t-статистиката да е по-голяма или равна от "t критично едностранно" е Алфа.

"P(T <= t) двустранно" дава вероятността, че стойността на t-статистиката би била наблюдавана като по-голяма по абсолютна стойност от t. "P критично двустранно" дава отрязаната стойност, така че вероятността t-статистиката да бъде наблюдавана като по-голяма по абсолютна стойност от "P критично двустранно" е Алфа.

t-тест: Две сдвоени по средни стойности проби

Можете да използвате сдвоен тест, когато има естествено сдвояване на наблюдения в образци, като например когато група образци се изпитва два пъти – преди и след експеримента. Този инструмент за анализ и неговата формула, извършват сдвоен t-тест на Стюдънт за две проби, за да определят дали наблюденията, които са извършени преди обработката и наблюденията, които са извършени след обработката, е вероятно да произлизат са от разпределения с еднакви средни стойности на генералната съвкупност. Тази форма на t-теста не предполага, че дисперсиите на двете генерални съвкупности са равни.

 Забележка   Измежду резултатите, които се генерират от този инструмент, е групираната дисперсия – натрупаната мярка на разпръснати около средната стойност данни, което произлиза от следната формула.


Формула за пресмятане на групирана дисперсия


t-тест: Две проби с предполагаемо равни дисперсии

Този инструмент за анализ извършва t-тест на Стюдънт с две проби. Тази форма на t-тест предполага, че двата набора данни се получават от разпределения с еднакви дисперсии. Той се посочва като t-тест с еднаква дисперсия. Можете да използвате този t-тест, за да определите дали е вероятно две проби за произхождат от разпределения с равни средни стойности на генералната съвкупност.

t-тест: Две проби с предполагаемо неравни дисперсии

Този инструмент за анализ извършва t-тест на Стюдънт с две проби. Тази форма на t-тест предполага, че двата набора данни се получават от разпределения с неравни дисперсии. Той се посочва като t-тест с различна дисперсия. Както в предишния случай на равни дисперсии, можете да използвате този t-тест, за да определите дали е вероятно две проби за произхождат от разпределения с равни средни стойности на генералната съвкупност. Използвайте този тест, когато в двете проби има различни обекти. Използвайте сдвоения тест, описан в следващия пример, когато има единичен набор от обекти и двете проби представят измервания за всеки обект, преди и след обработка.

Следната формула се използва за определяне на стойността на статистиката t.


Формула за изчисляване на стойността t


Следната формула се използва за изчисляване на степените на свобода df. Понеже резултатът от изчислението обикновено не е цяло число, стойността df се закръглява до най-близкото цяло число, за да се получи критична стойност от таблицата на t. Функцията на работен лист на Excel TTEST използва изчислената стойност на df без закръгляване, понеже е възможно да се изчисли стойност за TTEST с нецелочислено df. Поради тези различни подходи за определяне степените на свобода, резултатите на TTEST и на този инструмент за t-тест ще се различават в случая на неравни дисперсии.


Формула за приближение на степените на свобода


Покажиz-тест

z-тестът: Инструментът за анализ на две проби за средни стойности извършва z-тест на две проби за средни стойности с известни дисперсии. Този инструмент се използва за тестване на нулевата хипотеза, че няма разлика между средните стойности на двете генерални съвкупности, спрямо едностранни или двустранни алтернативни хипотези. Ако дисперсиите са известни, вместо това трябва да се използва функцията на работен лист ZTEST.

Когато използвате инструмента за z-тест, бъдете внимателни, за да разберете изхода. "P(Z <= z) едностранно" е всъщност P(Z >= ABS(z)) – вероятността z-стойност да бъде по-далеч от 0 в същата посока като наблюдаваната z стойност, когато няма разлика между средните стойности на генералните съвкупности. "P(Z <= z) двустранно" е всъщност P(Z >= ABS(z) или Z <= -ABS(z)) – вероятността на z-стойността да е по-далеч от 0 от наблюдаваната z-стойност, в едната или другата посока, когато няма разлика между средните стойности на генералните съвкупности. Двустранният резултат е точно едностранният резултат, умножен по 2. Инструментът за z-тест може също така да се използва за случая, когато нулевата хипотеза е, че има конкретна ненулева стойност за разликата между двете средни стойности на генералните съвкупности. Например можете да използвате този тест, за да определите разликите в експлоатационните качества на два модела коли.

 Забележки 

  • Функциите за анализ на данни могат да се използват не само от един работен лист по едно и също време. Когато извършвате анализ на данни за групирани работни листове, резултатите ще се показват в първия работен лист, а в останалите работни листове ще се появят празни форматирани таблици. За да извършите анализ на данни в останалите работни листове, повторете изчислението с инструмента за анализ за всеки работен лист.
  • За списък от книги, които предоставят подробна информация за статистическите методи или алгоритми, които са използвани при създаването на статистическите инструменти на Microsoft Office Excel вж. Библиография на статистически методи и алгоритми.
 
 
Отнася се за:
Excel 2007