Hvis du må utvikle kompliserte statistiske eller tekniske analyser, kan du spare tid ved å bruke analyseverktøyet. Du legger inn data og parametere for hver analyse, og verktøyet bruker passende statistiske eller tekniske makrofunksjoner til å beregne og deretter vise resultatet i en utdatatabell. Enkelte verktøy genererer diagrammer i tillegg til utdatatabellene.
Analyseverktøyet inneholder verktøyene som er beskrevet nedenfor. Du får tilgang til disse verktøyene ved å klikke Dataanalyse i Analyse-gruppen i kategorien Data. Hvis kommandoen Dataanalyse ikke er tilgjengelig, må du laste inn tilleggsprogrammet Analyseverktøy.
Laste inn analyseverktøyet
- Klikk Alternativer i kategorien Fil, og klikk deretter kategorien Tillegg.
- Velg Excel-tillegg i Behandle-boksen, og klikk deretter Start.
- I Tilgjengelige tillegg-boksen merker du av for Analyseverktøy, og klikker deretter OK.
Tips! Hvis Analyseverktøy ikke vises i Tilgjengelige tillegg-boksen, kan du klikke Bla gjennom for å finne det.
Hvis du får melding om at analyseverktøyet ikke er installert på datamaskinen, klikker du Ja for å installere det.
Obs! Hvis du vil ta med VBA-funksjoner (Visual Basic for Application) for Analyseverktøy, kan du laste inn tillegget Analyseverktøy - VBA på samme måte som du laster inn Analyseverktøy. I Tilgjengelige tillegg-boksen merker du av for Analyseverktøy - VBA.
Du får en beskrivelse av hvert verktøy ved å klikke et verktøynavn i følgende liste.
Bevegelig gjennomsnitt
Analyseverktøyet Bevegelig gjennomsnitt projiserer verdier i prognoseperioden, basert på gjennomsnittsverdien av variablene over et bestemt antall foregående perioder. Et bevegelig gjennomsnitt gir trendinformasjon som et enkelt gjennomsnitt av alle historiske verdier ville skjule. Du kan bruke dette verktøyet til å forutsi salg, vareopptelling eller andre trender. Hver prognoseverdi er basert på følgende formel.
der:
- N er antall tidligere perioder du vil ha med i det bevegelige gjennomsnittet
- Aj er den faktiske verdien på tidspunkt j
- Fj er prognoseverdien på tidspunkt j
Dataanalyse
Analyseverktøyene i Dataanalyse inneholder ulike verktøy for å analysere varians. Verktøyet du bør bruke, avhenger av antall faktorer og antall utdrag fra populasjonen du vil teste.
Variansanalyse: en faktor
Dette verktøyet utfører en enkel variansanalyse av data for to eller flere utvalg. Analysen tester hypotesen om at hvert utvalg er trukket fra samme underliggende sannsynlighetsfordeling, mot den alternative hypotesen om at underliggende sannsynlighetsfordelinger ikke er like for alle utvalg. Hvis det bare er to utvalg, kan du bruke regnearkfunksjonen TTEST. Hvis det er mer enn to utvalg, finnes det ingen passende generalisering av TTEST, og en-faktoranalysen kan brukes i stedet.
Variansanalyse: To-faktor med tilbakelegging
Dette analyseverktøyet er nyttig når data kan klassifiseres etter to forskjellige dimensjoner. I et eksperiment for å måle plantehøyde, kan for eksempel plantene ha forskjellige gjødselstyper (for eksempel A, B og C) og også forskjellige temperaturer (for eksempel lav og høy). For hvert av de seks mulige gjødsel- eller temperaturparene har vi et likt antall observasjoner av plantehøyde. Ved å bruke dette dataanalyseverktøyet kan vi teste:
- Om plantehøyden for de forskjellige gjødselstypene er trukket fra samme underliggende populasjon. Temperaturene er ikke tatt hensyn til i denne analysen.
- Om plantehøyden for de forskjellige temperaturnivåene er trukket fra samme underliggende populasjon. Gjødselstypene blir ikke tatt hensyn til i denne analysen.
Om det er gjort rede for virkningene av forskjellene mellom gjødselstypene i første punkt og temperaturene i andre punkt, med de seks utvalgene som representerer alle parverdiene for gjødsel eller temperatur trukket fra samme populasjon. Den alternative hypotesen er at det finnes virkninger som skyldes bestemte gjødsels -eller temperaturpar over og ovenfor forskjellene som er basert bare på gjødsel eller bare på temperatur.
Variansanalyse: To-faktor uten tilbakelegging
Dette analyseverktøyet er nyttig når data klassifiseres etter to forskjellige dimensjoner, som i tilfellet i to faktorer med tilbakelegging. I dette verktøyet antas det imidlertid at det bare finnes én observasjon for hvert par (for eksempel hvert gjødsels- eller temperaturpar i det forrige eksemplet).
Deskriptiv statistikk
Analyseverktøyet Deskriptiv statistikk genererer en rapport over univariat statistikk for data i inndataområdet. Denne rapporten gir informasjon om sentraltendens og spredning for dataene.
Eksponentiell glatting
Analyseverktøyet Eksponentiell glatting predikerer en verdi som er basert på prognosen for forrige periode, justert for feil i den forrige prognosen. Dette verktøyet bruker glattingskonstanten a. Størrelsen på denne konstanten avgjør i hvilken grad prognosene reagerer på feil i forrige prognose.
Obs! Verdier mellom 0,2 og 0,3 er fornuftige glattingskonstanter. Disse verdiene indikerer at prognosen bør justeres 20 til 30 % for feil i forrige prognose. Større konstanter gir raskere svar, men kan gi uberegnelige prognoser. Mindre konstanter kan resultere i lang ventetid på prognoseverdiene.
Fourier-analyse
Verktøyet Fourier-analyse løser problemer i lineære systemer og analyserer periodiske data ved at dataene transformeres ved hjelp av metoden "rask Fourier-transformasjon" (Fast Fourier Transform). Dette verktøyet støtter også inverse transformasjoner, der den inverse av transformerte data returnerer de opprinnelige dataene.
F-test: To utvalg for varianser
Analyseverktøyet F-test: To utvalg for varianser utfører en F-test med to utvalg for å sammenligne variansen i to populasjoner.
Du kan for eksempel bruke F-test-verktøyet for eksempler med tider i svømming for hvert av to lag. Verktøyet gir testresultatet for nullhypotese, det vil si at disse to utvalgene kommer fra fordelinger med lik varians, mot alternativet at variansen ikke er lik i underliggende fordelinger.
Verktøyet beregner verdien f av en F-statistikk (eller F-forhold). En f-verdi nær opptil 1 beviser at underliggende populasjonsvarianser er like. Hvis f < 1 "P(F <= f) ensidig" i utdatatabellen, er sannsynligheten for å observere en verdi i F-statistikken mindre enn f når populasjonsvariansene er like, og "F-kritisk ensidig" gir kritisk verdi mindre enn 1 for valgt signifikansnivå, Alfa. Hvis f > 1, "P(F <= f) ensidig", er sannsynligheten for å observere en verdi i F-statistikken større enn f når populasjonsvariansene er like og "F-kritisk ensidig" gir kritisk verdi større enn 1 for Alfa.
Generering av tilfeldige tall
Analyseverktøyet Generering av tilfeldige tall fyller et område med uavhengige, tilfeldige tall, trukket fra en eller flere fordelinger. Du kan beskrive elementene i en populasjon med en sannsynlighetsfordeling. Du kan for eksempel bruke en normalfordeling til å beskrive høyden på individene i en populasjon, eller bruke en Bernoulli-fordeling med to mulige resultater til å simulere en populasjon av mynt- og kronekast.
Histogram
Analyseverktøyet Histogram beregner enkeltfrekvenser og kumulative frekvenser for et celleområde med data og dataintervaller. Dette verktøyet genererer data for antall forekomster av verdier i et datasett.
I en klasse med 20 studenter kan du for eksempel være interessert i fordelingen av karakterer. En histogramtabell presenterer øvre og nedre karaktergrense, og antall karakterer mellom laveste grense og gjeldende grense. Den enkeltkarakter som forekommer hyppigst, utgjør modalverdien for dataene.
Korrelasjon
Regnearkfunksjonene KORRELASJON og PEARSON beregner begge korrelasjonskoeffisienten mellom to målingsvariabler når målingene av hver variabel observeres for hvert av N-emnene (når en observasjon for et emne mangler, blir emnet ikke tatt hensyn til i analysen). Korrelasjonsanalyseverktøyet er spesielt nyttig når det er flere enn to målingsvariabler for hvert av N-emnene. Det gis en utdatatabell, en korrelasjonsmatrise som viser KORRELASJON-verdien (eller PEARSON-verdien) som gjelder for hvert mulige målingsvariabelpar.
Korrelasjonskoeffisienten er som kovariansen en måling av hvor mye to målingsvariabler "varierer" sammen. I motsetning til kovariansen skaleres korrelasjonskoeffisienten slik at verdien er uavhengig av enhetene de to målingsvariablene er uttrykt i (hvis for eksempel de to målingsvariablene er vekt og høyde, forblir korrelasjonskoeffisienten uendret hvis vekten konverteres fra pund til kilogram). Verdien av alle korrelasjonskoeffisienter må være mellom eller lik -1 og +1.
Du kan bruke korrelasjonsanalyseverktøyet til å undersøke hvert målingsvariabelpar for å avgjøre om de to målingsvariablene viser samvariasjon – det vil si om store verdier i en variabel henger sammen med store verdier i den andre (positiv korrelasjon), om små verdier i en variabel henger sammen med store verdier i den andre (negativ korrelasjon), eller om verdiene i variablene ikke er relatert til hverandre (korrelasjon nær 0 (null)).
Kovarians
Verktøyene Korrelasjon og Kovarians kan begge brukes ved samme innstillinger, når du har observert N forskjellige målingsvariabler for et sett personer. Korrelasjons- og kovariansverktøyene har begge en utdatatabell, en matrise som viser henholdsvis korrelasjonskoeffisienten eller kovariansen mellom hvert målingsvariabelpar. Forskjellen er at korrelasjonskoeffisienter er skalert til å være mellom eller lik -1 og +1. De tilsvarende kovariansene skaleres ikke. Både korrelasjonskoeffisienten og kovariansen er målinger av hvor mye to variabler "varierer" sammen.
Verktøyet Kovarians beregner verdien av regnearkfunksjonen KOVARIANS for hvert målingsvariabelpar (direkte bruk av KOVARIANS i stedet for verktøyet Kovarians er et fornuftig alternativ når det bare er to målingsvariabler, det vil si at N=2). Oppføringen i diagonalen i utdatatabellen for verktøyet Kovarians i rad i, kolonne i er kovariansen målingsvariabel nummer i med seg selv. Dette er bare populasjonsvariansen for variabelen slik den beregnes i regnearkfunksjonen VARIANSP.
Du kan bruke kovariansanalyseverktøyet til å undersøke hvert målingsvariabelpar for å avgjøre om de to målingsvariablene viser samvariasjon – det vil si om store verdier i en variabel henger sammen med store verdier i den andre (positiv kovarians), om små verdier i en variabel henger sammen med store verdier i den andre (negativ kovarians), eller om verdiene i variablene ikke er relatert til hverandre (kovarians nær 0 (null)).
Rangering og persentil
Analyseverktøyet Rangering og persentil lager en tabell med ordenstallrangering og prosentdelrangering for hver verdi i et datasett. Du kan analysere den relative rangeringen for verdier i et datasett. Dette verktøyet bruker regnearkfunksjonene RANG og PROSENTDEL. RANG gjør ikke rede for uavgjorte verdier. Hvis du vil rede for uavgjorte verdier, bruker du regnearkfunksjonen RANG sammen med korrigeringsfaktoren som er foreslått i Hjelp-filen for RANG.
Regresjon
Analyseverktøyet Regresjon utfører lineær regresjonsanalyse ved hjelp av "minste kvadraters metode" til å tilpasse en linje til et sett observasjoner. Du kan analysere hvordan en enkelt variabel påvirkes av verdiene til en eller flere uavhengige variabler. Du kan for eksempel analysere hvordan ytelsen til en idrettsutøver påvirkes av faktorer som alder, høyde og vekt. Du kan knytte deler av prestasjonene til hver av de tre faktorene, basert på et sett prestasjonsdata, og deretter bruke resultatet til å predikere prestasjonene til en ny idrettsutøver som ikke har vært testet.
Verktøyet Regresjon bruker regnearkfunksjonen RETTLINJE.
T-test
Analyseverktøyene T-test for to utvalg tester likhet i populasjonsgjennomsnittet som ligger under hvert utvalg. De tre verktøyene har forskjellige forutsetninger: at populasjonsvariansene er like, at populasjonsvariansene ikke er like, og at de to utvalgene representerer observasjoner av de samme elementene før behandling og etter behandling.
For alle de tre verktøyene nedenfor beregnes en t-statistikkverdi, t, som vises som "t-stat" i utdatatabellene. Avhengig av dataene kan denne t-verdien være negativ eller ikke-negativ. Under forutsetningen av at de underliggende populasjonene har samme gjennomsnitt, hvis t < 0, "P(T <= t) ensidig", er sannsynligheten for at en verdi i t-statistikken vil bli observert som si være mer negativ enn t. Hvis t >=0, "P(T <= t) ensidig", er sannsynligheten for at en verdi i t-statistikken vil bli observert som er mer positiv enn t. "t-kritisk ensidig" gir en avkuttet verdi, slik at sannsynligheten for å observere en verdi i t-statistikken større enn eller lik "t-kritisk ensidig", er Alfa.
I "P(T <= t) tosidig" er sannsynligheten for at en verdi i t-statistikken som er større i absolutt verdi enn i t, vil observeres. "P-kritisk tosidig" gir en avkuttet verdi, slik at sannsynligheten for en observert t-statistikk som er større i absolutt verdi enn "P-kritisk tosidig", er Alfa.
T-test: Gjennomsnitt for to parvise utvalg
Du kan bruke en parvis test når det dannes naturlige observasjonspar i utvalgene, for eksempel når en utvalgsgruppe testes to ganger – før og etter et eksperiment. Dette analyseverktøyet og formelen utfører en partest med to utvalg for studenter for å avgjøre om observasjoner før en behandling og observasjoner som er tatt etter en behandling kan komme fra fordelinger der populasjonen har samme gjennomsnitt. I denne t-testen antas det ikke at variansen i populasjonene er like.
Obs! Blant resultatene som genereres av dette verktøyet er gruppevarians, et samlet mål på spredningen av data rundt gjennomsnittet, som er utledet fra formelen nedenfor.
T-test: To utvalg med antatt like varianser
Dette analyseverktøyet utfører en t-test med to utvalg av studenter. I denne typen t-test blir det antatt at de to datasettene kom fra fordelinger med like varianser. Testen kalles en homoskedastisk t-test. Du kan bruke denne t-testen til å avgjøre om det er sannsynlig at de to utvalgene kom fra fordelinger der populasjonen har samme gjennomsnitt.
T-test: To utvalg med antatt ulike varianser
Dette analyseverktøyet utfører en t-test for to utvalg av studenter. I denne typen t-test antas det at de to datasettene kom fra fordelinger med ulike varianser. Testen kalles en heteroskedastisk t-test. Slik som i det foregående tilfellet med lik varians, kan du bruke denne t-testen til å avgjøre om det er sannsynlig at de to utvalgene har kommet fra fordelinger der populasjonen har samme gjennomsnitt. Bruk denne testen når det er forskjellige elementer i de to utvalgene. Bruk den parvise testen som er beskrevet i følgende eksempel, når det er et enkelt sett elementer og de to utvalgene representerer målinger for hvert element før og etter en behandling.
Formelen nedenfor brukes til å finne den statistiske verdien t.
Følgende formel brukes til å beregne graden av frihet, df. Fordi resultatet av beregningen vanligvis ikke er et helt tall, rundes df-verdien av til nærmeste heltall for å få en kritisk verdi fra t-tabellen. Regnearkfunksjonen TTEST i Excel bruker den beregnede df-verdien uten å runde av, fordi det er mulig å beregne en verdi for TTEST uten en df med heltall. På grunn av disse forskjellige måtene å bestemme grad av frihet på, vil resultatene i TTEST og dette t-test-verktøyet være forskjellige fra tilfellet med ulik varians.
Utvalg
Analyseverktøyet Utvalg lager et utvalg fra en populasjon ved å behandle inndataområdet som en populasjon. Når populasjonen er for stor til at du kan behandle eller lage diagram av det, kan du bruke et representativt utvalg. Du kan også lage et utvalg som bare inneholder verdier fra en bestemt del av en syklus, hvis du tror at inndataene er periodiske. Hvis for eksempel inndataområdet inneholder salgstall for et kvartal, blir utvalgsverdiene fra samme kvartal lagt inn i utdataområdet.
Z-test
Analyseverktøyet Z-test: Gjennomsnitt for to parvise utvalg utfører en z-test for to utvalg for gjennomsnitt med kjente varianser. Dette verktøyet brukes til å teste nullhypotesen om at det ikke er noen forskjell mellom populasjonsgjennomsnitt, enten mot en ensidig eller en tosidig alternativ hypotese. Hvis variansene er kjent, bør regnearkfunksjonen ZTEST brukes i stedet.
Når du bruker Z-test-verktøyet, bør du være nøye på at du forstår utdataene. "P(Z <= z) ensidig" er egentlig P(Z >= ABS(z)), sannsynligheten for en z-verdi lengre fra 0 i samme retning som den observerte z-verdien når det ikke er noen forskjell mellom populasjonsgjennomsnittene. "P(Z <= z) tosidig" er egentlig P(Z >= ABS(z) or Z <= -ABS(z)), sannsynligheten for en z-verdi lengre fra 0 i hvilken som helst retning enn den observerte z-verdien når det ikke er noen forskjell mellom populasjonsgjennomsnittene. Det tosidige resultatet er bare det ensidige resultatet multiplisert med 2. Z-test-verktøyet kan også brukes i tilfellet der nullhypotesen er at det er en bestemt ikke-null-verdi for forskjellen mellom de to populasjonsgjennomsnittene. Du kan for eksempel bruke denne testen til å finne forskjellen i ytelse mellom to bilmodeller.
Obs! Dataanalysefunksjonene kan bare brukes i ett regneark om gangen. Når du utfører dataanalyser i grupperte regneark, vises resultatet i det første regnearket, mens tomme, formaterte tabeller blir vist i resten av regnearkene. Når du skal utføre dataanalyser i resten av regnearkene, må du omberegne analyseverktøyet for hvert regneark.