Als u complexe statistische en technische analyses moet ontwerpen, kunt u het Analysis ToolPak gebruiken om tijd te besparen. U geeft de gegevens en parameters voor elke analyse op. Vervolgens worden in het hulpprogramma de relevante statistische macrofuncties of ontwikkelingsmacrofuncties toegepast en worden de resultaten in een uitvoertabel weergegeven. In een aantal hulpprogramma's worden naast uitvoertabellen ook grafieken gegenereerd.
Het Analysis ToolPak bestaat uit de hulpprogramma's die hierna worden beschreven. Klik op Gegevensanalyse in de groep Analyse op het tabblad Gegevens om toegang te krijgen tot deze hulpprogramma's. Als de opdracht Gegevensanalyse niet beschikbaar is, moet u het invoegprogramma Analysis ToolPak laden.
Het Analysis ToolPak laden
- Klik op de Microsoft Office-knop
en klik op Opties voor Excel.
- Klik op Invoegtoepassingen en selecteer Excel-invoegtoepassingen in het vak Beheren.
- Klik op Start.
- Schakel in het vak Beschikbare invoegtoepassingen het selectievakje Analysis ToolPak in en klik vervolgens op OK.
Tip Als Analysis ToolPak niet voorkomt in het vak Beschikbare invoegtoepassingen, klikt u op Bladeren om het op te zoeken.
Als het bericht verschijnt dat Analysis ToolPak niet is geïnstalleerd op uw computer, klikt u op Ja om het te installeren.
Opmerking Als u over de functies van Visual Basic for Application (VBA) wilt beschikken in Analysis ToolPak, kunt u de invoegtoepassing Analysis ToolPak - VBA op dezelfde manier laden als Analysis ToolPak. In het vak Beschikbare invoegtoepassingen schakelt u het selectievakje Analysis ToolPak - VBA in.
Voor een beschrijving van een hulpprogramma klikt u in onderstaande lijst op de naam van het gewenste hulpprogramma.
Variantie-analyse
De hulpprogramma's voor variantie-analyse voorzien in verschillende typen variantie-analyse. Welk hulpprogramma u het best kunt gebruiken, is afhankelijk van het aantal factoren en het aantal steekproeven dat u hebt van de te toetsen populaties.
Unifactoriële variantie-analyse
Met dit hulpprogramma kunt u een eenvoudige variantie-analyse uitvoeren op gegevens van twee of meer steekproeven. Deze analyse toetst de hypothese dat elke steekproef is getrokken uit dezelfde onderliggende kansverdeling tegenover de alternatieve hypothese dat onderliggende kansverdelingen niet voor alle steekproeven hetzelfde zijn. Als er slechts twee steekproeven zijn, kunt u ook de werkbladfunctie T.TOETS gebruiken. Als er meer dan twee steekproeven zijn, is er geen geschikte generalisatie van T.TOETS. U kunt in dit geval wel gebruikmaken van de unifactoriële variantie-analyse.
Multifactoriële variantie-analyse met herhaling
Dit analysehulpprogramma gebruikt u wanneer gegevens kunnen worden geclassificeerd volgens twee dimensies. Bijvoorbeeld: in een experiment waarbij de hoogte van planten wordt gemeten, kunt u de planten verschillende merken kunstmest geven (bijvoorbeeld A, B, C) en bij verschillende temperaturen kweken (bijvoorbeeld hoog en laag). Voor elk van de zes mogelijke paren {kunstmest, temperatuur} hebben we een gelijk aantal waarnemingen van de planthoogte. Met dit hulpprogramma kunnen we toetsen:
- Of hoogten van planten voor de verschillende merken kunstmest uit dezelfde onderliggende populatie zijn getrokken. De temperaturen worden voor deze analyse genegeerd.
- Of hoogten van planten voor de verschillende temperatuurniveaus uit dezelfde onderliggende populatie zijn getrokken. De kunstmestmerken worden voor deze analyse genegeerd.
Of er nu een verklaring is gegeven voor de effecten van verschillen tussen kunstmestmerken die zijn aangetroffen in stap 1 en verschillen in temperaturen die zijn aangetroffen in stap 2, de zes steekproeven die alle paren van {kunstmest, temperatuur}-waarden vertegenwoordigen, worden uit dezelfde populatie getrokken. De alternatieve hypothese is dat er effecten zijn die zijn toe te schrijven aan specifieke {kunstmest, temperatuur }-paren buiten verschillen op basis van alleen kunstmest of van alleen temperatuur.
Multifactoriële variantie-analyse zonder herhaling
Dit analysehulpprogramma gebruikt u wanneer gegevens in twee verschillende dimensies zijn geclassificeerd, net als bij de multifactoriële variantie-analyse met herhaling. Bij dit hulpprogramma gaan we er echter vanuit dat er voor elk paar (bijvoorbeeld elk {kunstmest, temperatuur}-paar in het bovenstaande voorbeeld) maar één waarneming is.
Correlatie
De werkbladfuncties CORRELATIE en PEARSON berekenen allebei de correlatiecoëfficient tussen twee meetvariabelen wanneer metingen op elke variabele worden waargenomen voor elk van N onderwerpen. (Een ontbrekende waarneming voor een onderwerp heeft tot gevolg dat dit onderwerp in de analyse wordt genegeerd) Het analysehulpmiddel Correlatie gebruikt u met name wanneer er meer dan twee meetvariabelen voor elk van N onderwerpen zijn. In de uitvoertabel, een correlatiematrix, wordt de waarde van CORRELATIE (of PEARSON) weergegeven die op elk mogelijk paar meetvariabelen wordt toegepast.
Net als de covariantie geeft de correlatiecoëfficiënt aan in welke mate twee meetvariabelen 'gezamenlijk variëren'. Anders dan bij de covariantie is de waarde van de correlatiecoëfficiënt onafhankelijk van de eenheden waarin de twee meetvariabelen worden uitgedrukt. (Als de twee meetvariabelen bijvoorbeeld gewicht en hoogte zijn, blijft de waarde van de correlatiecoëfficient ongewijzigd als gewicht wordt geconverteerd van ponden naar kilo's) De waarde van een correlatiecoëfficiënt moet zich bevinden tussen -1 en +1 (deze twee waarden inbegrepen).
Met het covariantiehulpprogramma kunt u elk paar meetvariabelen onderzoeken om vast te stellen of de twee meetvariabelen min of meer met elkaar samenhangen. Bij een positieve covariantie gaan grote waarden in de ene variabele min of meer samen met grote waarden in de andere variabele. Als kleine waarden in de ene variabele min of meer samengaan met grote waarden in de andere variabele, is er sprake van een negatieve covariantie. Het is ook mogelijk dat de waarden van beide variabelen geen of weinig samenhang vertonen (de covariantie nadert de waarde nul).
Covariantie
De hulpprogramma's Correlatie en Covariantie kunnen allebei in dezelfde situatie worden gebruikt, wanneer u beschikt over N verschillende meetvariabelen, die zijn waargenomen in een verzameling individuen. De hulpprogramma's Correlatie en Covariantie geven elk een uitvoertabel, een matrix, waarin respectievelijk de correlatiecoëfficiënt of covariantie tussen elk paar meetvariabelen wordt weergegeven. Het verschil is dat correlatiecoëfficiënten zich altijd bevinden tussen -1 en +1 (deze waarden inbegrepen), terwijl dit bij overeenkomstige covarianties niet het geval hoeft te zijn. Zowel de correlatiecoëfficiënt als de covariantie geven aan in welke mate twee variabelen 'gezamenlijk variëren'.
Het hulpprogramma Covariantie berekent de waarde van de werkbladfunctie COVARIANTIE voor elk paar meetvariabelen. (Het kan handig zijn om COVAR te gebruiken in plaats van het hulpprogramma Covariantie wanneer er slechts twee meetvariabelen zijn, dus N=2.) De invoer op de diagonaal van de uitvoertabel van het hulpprogramma Covariantie in rij i, kolom i is de covariantie van de i-e meetvariabele met zichzelf. Dit is de populatievariantie voor die variabele zoals berekend door de werkbladfunctie VARP.
Met het hulpprogramma Covariantie kunt u elk paar meetvariabelen onderzoeken om vast te stellen of de twee meetvariabelen min of meer met elkaar samenhangen. Bij een positieve covariantie gaan grote waarden in de ene variabele min of meer samen met grote waarden in de andere variabele. Als kleine waarden in de ene variabele min of meer samengaan met grote waarden in de andere variabele, is er sprake van een negatieve covariantie. Het is ook mogelijk dat de waarden van beide variabelen geen of weinig samenhang vertonen (de covariantie nadert de waarde nul).
Beschrijvende statistiek
Met het analyseprogramma Beschrijvende statistiek wordt een univariaat statistisch rapport gegenereerd voor gegevens in het invoerbereik. Het rapport verstrekt informatie over de centrale trend en de variabiliteit van de gegevens.
Exponentiële demping
Met het analysehulpprogramma Exponentiële demping wordt een waarde voorspeld op basis van de voorspelling voor de voorgaande periode, bijgesteld voor de fout in deze voorspelling. In het hulpprogramma wordt de dempingsconstante a gebruikt. De grootte van de dempingsconstante bepaalt in hoeverre rekening met fouten in eerdere voorspellingen wordt gehouden.
Opmerking Waarden tussen 0,2 en 0,3 zijn redelijke dempingsconstanten. Deze waarden geven aan dat de huidige voorspelling met 20 tot 30 procent moet worden bijgesteld vanwege fouten in de voorgaande voorspelling. Als u een hogere waarde opgeeft, worden de resultaten sneller berekend, maar neemt de kans op foutieve voorspellingen toe. Lagere waarden kunnen leiden tot grote vertragingen bij het berekenen van de waarden.
F-toets voor twee steekproeven op varianties
Met het analysehulpprogramma F-toets voor twee steekproeven op varianties worden de populatievarianties van twee steekproeven getoetst.
U kunt het hulpprogramma F-toets bijvoorbeeld gebruiken op steekproeven van de tijden die door elk van twee teams zijn behaald bij een zwemwedstrijd. Het hulpprogramma geeft de uitkomst van een toets van de null-hypothese dat deze twee steekproeven behoren tot verdelingen met gelijke varianties ten opzichte van het alternatief dat de varianties niet gelijk zijn in de onderliggende verdelingen.
Het hulpprogramma berekent de waarde f van een toetsingsgrootheid F (of F-ratio). Een waarde van f dicht bij 1 levert het bewijs dat de onderliggende populatievarianties gelijk zijn. Als in de uitvoertabel f < 1 geeft 'P(F <= f) eenzijdig' de kans een waarde van de toetsingsgrootheid F kleiner dan f waar te nemen wanneer populatievarianties gelijk zijn. 'Eenzijdige kritische F-waarde' geeft de kritische waarde kleiner dan 1 voor het gekozen significantieniveau Alfa. Als f > 1, geeft 'P(F <= f) eenzijdig' de kans een waarde van de toetsingsgrootheid F groter dan f waar te nemen wanneer populatievarianties gelijk zijn. 'Eenzijdige kritische F-waarde' geeft de kritische waarde groter dan 1 voor alfa.
Fourier-analyse
Met het hulpprogramma Fourier-analyse lost u vraagstukken in lineaire systemen op en analyseert u periodieke gegevens. Hiervoor worden gegevens getransformeerd met de FFT-methode (Fast Fourier Transform). In dit hulpprogramma worden ook inverse transformaties ondersteund zodat u de getransformeerde gegevens weer kunt omzetten in de oorspronkelijke gegevens.
Histogram
Met het analysehulpprogramma Histogram worden afzonderlijke en cumulatieve frequenties berekend voor een cellenbereik met gegevens en grenswaarden. U kunt met dit hulpprogramma bepalen hoe vaak een bepaalde waarde in een gegevensverzameling voorkomt.
Als u bijvoorbeeld wilt weten hoe in een klas met twintig leerlingen de proefwerkcijfers in bepaalde categorieën zijn verdeeld, kunt u dat met dit hulpprogramma bepalen. Een histogram laat zien welke cijfers de begrenzing van de categorieën vormen en geeft het aantal cijfers tussen de benedengrens en de huidige grens weer. Het meest behaalde cijfer is dan de modus van het gegevensbereik.
Zwevend gemiddelde
Het analysehulpprogramma Zwevend gemiddelde projecteert waarden in de voorspellingsperiode, op basis van de gemiddelde waarde van de variabele over een bepaald aantal voorafgaande perioden. Een zwevend gemiddelde geeft u informatie over trends die u niet krijgt als u een eenvoudig gemiddelde van alle historische gegevens berekent. U kunt dit hulpprogramma gebruiken voor verkoopprognoses, voorspellingen over de voorraadbehoefte en andere trends. Elke voorspellingswaarde is gebaseerd op de volgende formule.
waarbij:
- N het aantal voorgaande perioden is dat in het zwevend gemiddelde wordt opgenomen.
- Aj de actuele waarde is op het moment j.
- Fj de voorspellingswaarde is op het moment j.
Aselecte getallen
Met het analysehulpprogramma Aselecte getallen wordt een bereik gevuld met onafhankelijke aselecte getallen die uit één van een aantal afzonderlijke verdelingen worden getrokken. U kunt dit hulpprogramma gebruiken om aan onderdelen van een populatie een kansverdeling toe te kennen. U kunt bijvoorbeeld een normale verdeling toekennen aan een populatie bestaande uit de lichaamslengte van personen, of een Bernoulli-verdeling van twee mogelijke waarden aan de populatie bestaande uit de uitkomsten van een 'kruis-of-munt'-proef.
Rang en percentiel
Met het analysehulpprogramma Rang en percentiel wordt een tabel gegenereerd met voor elke waarde in een gegevensverzameling de rangwaarde en de percentiele waarde. U kunt dit hulpprogramma gebruiken om de relatieve positie van waarden in een gegevensverzameling te analyseren. Dit hulpprogramma gebruikt de werkbladfuncties RANG en PERCENT.RANG. RANG houdt geen rekening met identieke waarden. Als u rekening wilt houden met identieke waarden, gebruikt u de werkbladfunctie RANG in combinatie met de correctiefactor die in het Help-bestand van RANG wordt voorgesteld.
Regressie
Met het hulpprogramma Regressie wordt een lineaire regressieanalyse uitgevoerd met behulp van de methode "kleinste kwadraten" om een lijn door een verzameling gegevens uit te zetten. Bij deze analyse wordt met de methode van de kleinste kwadraten een lijn getrokken door de verzameling waarnemingen. Regressie wordt vaak toegepast om te analyseren hoe een enkele afhankelijke variabele wordt beïnvloed door de waarde van een of meer onafhankelijke variabelen.
Het hulpprogramma Regressie maakt gebruik van de werkbladfunctie LIJNSCH.
Steekproef
Met het analysehulpprogramma Steekproef wordt een steekproef uit een populatie genomen, waarbij het invoerbereik als een populatie wordt beschouwd. Als de populatie te groot is om te verwerken of in een grafiek weer te geven, kunt u gebruikmaken van een representatieve steekproef. Bovendien kunt u, als het invoerbereik periodieke gegevens bevat, een steekproef nemen die alleen waarden bevat uit een bepaald deel van de cyclus. Als het invoerbereik bijvoorbeeld kwartaalcijfers bevat, worden bij een steekproef met een periodiek van 4 de waarden uit hetzelfde kwartaal in de uitvoertabel geplaatst.
T-toets
De hulpprogramma's voor T-toets met twee gepaarde steekproeven testen of de populatiegemiddelden van elke steekproef gelijk zijn. De drie hulpprogramma's gaan uit van verschillende veronderstellingen: dat de populatievarianties gelijk zijn, dat de populatievarianties niet gelijk zijn, en dat de twee steekproeven voor en na behandeling waarnemingen weergeven over dezelfde onderdelen.
Voor alle drie onderstaande hulpprogramma's wordt een toetsingsgrootheid t berekend en weergegeven als 't Stat' in de uitvoertabellen. Afhankelijk van de gegevens kan deze waarde, t, negatief of niet-negatief zijn. Uitgaande van gelijke onderliggende populatiegemiddelden, als t < 0, geeft 'P(T <= t) eenzijdig' de kans dat een waarde van de toetsingsgrootheid t wordt waargenomen die negatiever is dan t. Als t >=0, geeft 'P(T <= t) eenzijdig' de kans dat een waarde van de toetsingsgrootheid t wordt waargenomen die positiever is dan t. 'Eenzijdige kritische t-waarde' geeft de grenswaarde waarbij de kans een waarde van de toetsingsgrootheid t groter dan of gelijk aan 'eenzijdige kritische t-waarde' waar te nemen, gelijk is aan Alfa.
'P(T <= t) tweezijdig' geeft de kans dat een waarde van toetsingsgrootheid t wordt geobserveerd die groter is in absolute waarde dan t. 'Tweezijdige kritische P-waarde' geeft de grenswaarde waarbij de kans van een waargenomen toetsingsgrootheid t groter in absolute waarde dan 'tweezijdige kritische P-waarde' gelijk is aan Alfa.
T-toets: twee gepaarde steekproeven voor gemiddelden
T-toets: twee gepaarde steekproeven voor gemiddelden. Een gepaarde toets wordt toegepast wanneer er sprake is van een natuurlijke gepaardheid van waarnemingen in de steekproeven, bijvoorbeeld wanneer een steekproefgroep zowel voor als na een experiment wordt getoetst. Met deze variant van de T-toets voert u een gepaarde T-toets uit op twee steekproeven om vast te stellen of het waarschijnlijk is dat waarnemingen die zijn gedaan voor een behandeling en waarnemingen die zijn gedaan na een behandeling behoren tot verdelingen met gelijke populatiegemiddelden. Er wordt bij deze T-toetsvariant niet van uitgegaan dat de varianties van beide populaties gelijk zijn.
Opmerking Dit hulpprogramma geeft als resultaat onder meer de gepaarde variantie aan, een maat voor de spreiding van gegevens om het gemiddelde, die wordt afgeleid uit de volgende formule:
T-toets: twee gepaarde steekproeven met gelijke varianties
Met dit analysehulpprogramma voert u een T-toets uit op twee steekproeven. In deze toets wordt ervan uitgegaan dat de twee gegevensverzamelingen behoren tot verdelingen met gelijke varianties. De toets wordt daarom ook wel een homoscedastische T-toets genoemd. Met deze T-toets kunt u vaststellen of het waarschijnlijk is dat de twee steekproeven behoren tot verdelingen met gelijke populatiegemiddelden.
T-toets: twee gepaarde steekproeven met ongelijke varianties
Met dit analysehulpprogramma voert u een T-toets uit op twee steekproeven. Bij deze variant van de T-toets wordt ervan uitgegaan dat de twee gegevensverzamelingen behoren tot verdelingen met ongelijke varianties. Deze toets wordt daarom ook wel een heteroscedastische T-toets genoemd. Net als bij de eerder besproken T-toets met twee gepaarde steekproeven met gelijke varianties kunt met deze T-toets vaststellen of het waarschijnlijk is dat de twee steekproeven behoren tot verdelingen met gelijke populatiegemiddelden. Gebruik deze toets als er sprake is van verschillende onderdelen in de twee steekproeven. Gebruik de verderop beschreven gepaarde toets als er sprake is van één verzameling onderdelen en de twee steekproeven gegevens hebben voor elk onderdeel voor en na een behandeling.
De volgende formule wordt gebruikt om de statistische waarde t vast te stellen.
Met de volgende formule worden de vrijheidgraden, vg, berekend. Aangezien de uitkomst van de berekening meestal geen geheel getal is, wordt de waarde van vg afgerond op het dichtstbijzijnde gehele getal om een kritische waarde uit de tabel t te verkrijgen. De Excel-werkbladfunctie T.TOETS gebruikt de berekende vg-waarde zonder afronding omdat het mogelijk is een waarde voor T.TOETS te berekenen met een vg-waarde die geen geheel getal is. Vanwege deze verschillen bij het bepalen van de vrijheidsgraden, zullen de uitkomsten van T.TOETS en dit hulpprogramma verschillend zijn als er sprake is van ongelijk varianties.
Z-toets
Met het analysehulpprogramma Z-toets: twee steekproeven voor gemiddelden wordt een Z-toets uitgevoerd op de gemiddelden van twee steekproeven met bekende varianties. Dit hulpprogramma wordt gebruikt om de null-hypothese dat er geen verschil is tussen twee populatiegemiddelden te toetsen in vergelijking tot een- of tweezijdige alternatieve hypothesen.
Wanneer u het hulpprogramma Z-toets gebruikt, is het van belang de uitvoer goed te begrijpen. 'P(Z <= z) eenzijdig' is in feite P(Z >= ABS(z)), de kans van een z-waarde verder van 0 in dezelfde richting als de waargenomen z-waarde wanneer er geen verschil is tussen de populatiegemiddelden. 'P(Z <= z) tweezijdig' is in feite P(Z >= ABS(z) of Z <= -ABS(z)), de kans van een z-waarde verder van 0 in een van beide richtingen dan de waargenomen z-waarde wanneer er geen verschil is tussen de populatiegemiddelden. De tweezijdige uitkomst is niet meer dan de eenzijdige uitkomst vermenigvuldigd met 2. Het hulpprogramma Z-toets kan ook worden gebruikt wanneer de null-hypothese is dat er een specifieke niet-nulwaarde is voor het verschil tussen de twee populatiegemiddelden.
Opmerkingen
- De functies voor gegevensanalyse kunnen slechts in één werkblad tegelijk worden gebruikt. Als u gegevens in gegroepeerde werkbladen analyseert, wordt het resultaat in het eerste werkblad weergegeven en worden in de overige werkbladen lege, opgemaakte tabellen weergegeven. Als u de gegevensanalyse ook in de overige werkbladen wilt toepassen, moet u het analysehulpprogramma op elk werkblad opnieuw toepassen.
- Zie Een bibliografie van statistische methoden en algoritmen voor een lijst met boeken met gedetailleerde informatie over de statistische methoden en de algoritmen die bij het ontwikkelen van de statistische hulpprogramma's en functies van Microsoft Office Excel zijn gebruikt.