In diesem Artikel werden die Formelsyntax und die Verwendung der Funktion (Funktion: Eine vordefinierte Formel, an die ein oder mehrere Werte übergeben werden müssen, die eine Operation ausführt und einen oder mehrere Werte zurückgibt. Verwenden Sie Funktionen, um insbesondere solche Formeln in einem Tabellenblatt zu vereinfachen und zu verkürzen, mit denen lange oder komplexe Berechnungen durchgeführt werden.) RGP in Microsoft Office Excel beschrieben. Verknüpfungen zu weiteren Informationen über das Erstellen von Diagrammen und Ausführen einer Regressionsanalyse finden Sie im Abschnitt Siehe auch.
Beschreibung
Die Funktion RGP berechnet die Statistik für eine Linie nach der Methode der kleinsten Quadrate, um eine gerade Linie zu berechnen, die am besten an die Daten angepasst ist, und gibt dann ein Array zurück, das die Linie beschreibt. Sie können RGP auch mit anderen Funktionen kombinieren, um die Statistiken für andere Modelltypen zu berechnen, die linieare unbekannte Parameter aufweisen, einschließlich polynomischer, logarithmischer und exponentieller Reihen sowie Potenzen. Da diese Funktion ein Array von Werten zurückgibt, muss die Formel als Arrayformel eingegeben werden. Anweisungen dazu sind nach den Beispielen in diesem Artikel angegeben.
Die Gleichung einer solchen Geraden lautet:
y = mx + b
–oder–
y = m1x1 + m2x2 + ... + b (bei mehreren Bereichen mit x-Werten)
Dabei sind die abhängigen y-Werte eine Funktion der unabhängigen x-Werte. Die m-Werte sind Koeffizienten, die zu den jeweiligen x-Werten gehören, und b ist eine Konstante. Es ist zu beachten, dass y, x und m Vektoren sein können. Ein von der Funktion RGP ausgegebenes Array liegt in der Form {mn;mn-1;...;m1;b} vor. RGP kann darüber hinaus zusätzliche Regressionskenngrößen bereitstellen.
Syntax
RGP(Y_Werte;[X_Werte];[Konstante];[Stats])
Die Syntax der Funktion RGP weist die folgenden Argumente (Argument: Ein Wert, der Informationen zu einer Aktion, einem Ereignis, einer Methode, einer Eigenschaft, einer Funktion oder einer Prozedur bereitstellt.) auf:
- Y_Werte Erforderlich. Die y-Werte, die Ihnen bereits aus der Beziehung y = mx + b bekannt sind.
- Besteht der Bereich der Y_Werte aus nur einer Spalte, wird jede Spalte für X_Werte als eigenständige Variable interpretiert.
- Besteht der Bereich der Y_Werte aus nur einer Zeile, wird jede Zeile für X_Werte als eigenständige Variable interpretiert.
- X_Werte Optional. Die x-Werte, die Ihnen möglicherweise bereits aus der Beziehung y = mx + b bekannt sind.
- Der Bereich der X_Werte kann eine oder mehrere Variablengruppen umfassen. Wird nur eine Variable verwendet, können Y_Werte und X_Werte Bereiche beliebiger Form sein, solange sie dieselben Dimensionen haben. Werden mehrere Variablen verwendet, muss Y_Werte ein Vektor sein (das heißt ein Bereich, der aus nur einer Zeile oder nur einer Spalte besteht).
- Fehlt die Angabe X_Werte, wird an ihrer Stelle das Array {1;2;3;...} angenommen, das genauso viele Elemente wie Y_Werte enthält.
- Konstante Optional. Ein Wahrheitswert, der angibt, ob die Konstante b den Wert 0 annehmen soll.
- Ist Konstante mit WAHR belegt oder nicht angegeben, wird b normal berechnet.
- Ist Konstante mit FALSCH belegt, wird b gleich 0 festgelegt, und die m-Werte werden so angepasst, dass sie zu der Beziehung y = mx passen.
- Stats Optional. Ein Wahrheitswert, der angibt, ob zusätzliche Regressionskenngrößen zurückgegeben werden sollen.
- Ist Stats mit WAHR belegt, gibt RGP weitere Regressionskenngrößen zurück, sodass ein Array in der Form {mn;mn-1;...;m1;b.sen;sen-1;...;se1;seb.r2;sey.F;df.ssreg;ssresid} zurückgegeben wird.
- Ist Stats mit FALSCH belegt oder nicht angegeben, gibt RGP nur die m-Koeffizienten sowie die Konstante b zurück.
Die folgenden Regressionskenngrößen (-statistiken) können zusätzlich ermittelt werden:
| Kenngröße (Statistik) |
Beschreibung |
| se1;se2;...;sen |
Sind die Standardfehler der Koeffizienten m1;m2;...;mn. |
| seb |
Der Standardfehler der Konstanten b (seb = #NV, wenn Konstante mit FALSCH belegt ist). |
| r2 |
Das Bestimmtheitsmaß. Vergleicht die erwarteten mit den tatsächlichen y-Werten und kann Werte von 0 bis 1 annehmen. Besitzt es den Wert 1, besteht für die Stichprobe eine vollkommene Korrelation: ein erwarteter y-Wert und der entsprechende tatsächliche y-Wert unterscheiden sich nicht. Im anderen Extremfall, wenn das Bestimmtheitsmaß 0 ist, ist die Regressionsgerade nicht dazu geeignet, einen y-Wert vorherzusagen. Informationen darüber, wie r2 berechnet wird, finden Sie unten unter "Hinweise". |
| sey |
Der Standardfehler des Schätzwerts y (Prognosewert). |
| F |
Die F-Statistik (oder der berechnete F-Wert). Anhand der F-Statistik können Sie entscheiden, ob die zwischen der abhängigen und der unabhängigen Variablen beobachtete Beziehung zufällig ist oder nicht. |
| df |
Der Freiheitsgrad. Mit diesem Freiheitsgrad können Sie den jeweiligen kritischen F-Wert (Quantil F) aus einer entsprechenden statistischen Tabelle entnehmen. Vergleichen Sie den jeweils auf diese Weise ermittelten kritischen F-Wert mit der von RGP zurückgegebenen F-Statistik, um das Konfidenzniveau Ihres Modells zu beurteilen. Informationen zur Berechnung von df finden Sie unter "Hinweise". In Beispiel 4 ist die Verwendung von F und df dargestellt. |
| ssreg |
Die Regressions-Quadratsumme. |
| ssresid |
Die Residual-Quadratsumme (Summe der Abweichungsquadrate). Weitere Informationen zur Berechnung von ssreg und ssresid finden Sie unter "Hinweise". |
Die folgende Abbildung zeigt, in welcher Reihenfolge die zusätzlichen Regressionskenngrößen zurückgegeben werden.
Hinweise
- Jede Gerade lässt sich durch ihre Steigung und die jeweilige Anfangsordinate (y-Achsenabschnitt) beschreiben:
Steigung (m):
Die Steigung einer Geraden (häufig als m bezeichnet) lässt sich aus zwei Punkten der Geraden, (x1,y1) und (x2,y2), gemäß der Beziehung (y2 - y1)/(x2 - x1) berechnen.
y-Achsenabschnitt (b):
Der y-Achsenabschnitt (häufig als b bezeichnet) ist der y-Wert des Punkts, in dem die Gerade die y-Achse schneidet.
Eine Gerade wird durch die Gleichung y = mx + b beschrieben. Sobald Ihnen die Werte von m und b bekannt sind, können Sie alle Punkte der Geraden berechnen, indem Sie den jeweiligen y- oder x-Wert in die Gleichung einsetzen. Sie können dafür auch die TREND-Funktion verwenden.
- Wenn nur eine unabhängige x-Variable vorliegt, können Sie die Steigung und den y-Achsenabschnitt direkt mithilfe der folgenden Formeln ermitteln:
Steigung:
=INDEX(RGP(Y_Werte;X_Werte);1)
y-Achsenabschnitt:
=INDEX(RGP(Y_Werte;X_Werte);2)
- Die Genauigkeit einer von der RGP-Funktion berechneten Geraden hängt davon ab, wie sehr die betreffenden Daten gestreut sind. Je linearer sich die Daten verhalten, desto genauer ist das von RGP ermittelte Modell. RGP verwendet die Methode der kleinsten Quadrate, um die für die jeweiligen Daten beste Anpassung zu ermitteln. Wenn nur eine unabhängige x-Variable vorliegt, werden m und b entsprechend der folgenden Formeln berechnet:
wobei x und y Beispielmöglichkeiten darstellen, d. h. x = MITTELWERT(X_Werte) und y = MITTELWERT(Y_Werte).
- Die Regressionsfunktionen RGP (lineare Regression) und RKP (exponentielle Regression) können die Koeffizienten der an die von Ihnen bereitgestellten Daten optimal angepassten Geraden beziehungsweise Exponentialkurve berechnen. Sie müssen dennoch entscheiden, welches der beiden Ergebnisse Ihren Daten eher entspricht. Bei einer Geraden können Sie TREND(Y_Werte;X_Werte) und bei einer Exponentialkurve VARIATION(Y_Werte;X_Werte) berechnen. Werden diese Funktionen ohne das Argument Neue_x_Werte verwendet, geben sie ein Array mit y-Werten zurück, die an den x-Werten Ihrer tatsächlichen Datenpunkte als Vorhersagewerte auf der Geraden oder Exponentialkurve liegen. Diese Vorhersagewerte können Sie mit den tatsächlichen Werten vergleichen. Um eine bessere Vergleichsmöglichkeit zu haben, kann es sinnvoll sein, die Werte in Diagrammen darzustellen.
- Bei der Regressionsanalyse berechnet Excel für jeden Punkt das Quadrat der Differenz zwischen dem für diesen Punkt erwarteten y-Wert und dem entsprechenden tatsächlichen y-Wert. Die Summe dieser quadrierten Differenzen wird als Residual-Quadratsumme (ssresid) bezeichnet. Anschließend berechnet Excel die Gesamtsumme der Abweichungsquadrate (sstotal). Ist das Argument Konstante mit WAHR belegt oder nicht angegeben, entspricht die Gesamtsumme der Abweichungsquadrate der Summe der quadratischen Differenzen zwischen den tatsächlichen y-Werten und dem Mittelwert der y-Werte. Wenn das Argument Konstante mit FALSCH belegt ist, entspricht die Gesamtsumme der Abweichungsquadrate den Quadraten der tatsächlichen y-Werte (ohne Subtraktion der Mittelwerte aller y-Werte von jedem einzelnen y-Wert). Anschließend kann die Regressions-Quadratsumme (ssreg) anhand der folgenden Gleichung berechnet werden: ssreg = sstotal - ssresid. Je kleiner die Residual-Quadratsumme im Vergleich zur Gesamtsumme der Abweichungsquadrate ist, desto größer ist der Wert des Bestimmtheitsmaßes (r2), das angibt, wie gut die aus der Regressionsanalyse resultierende Gleichung die zwischen den Variablen bestehende Beziehung beschreibt. Der Wert r2 ist gleich ssreg/sstotal.
- In einigen Fällen enthalten eine oder mehrere der X-Spalten (wenn sich y-Werte und x-Werte in Spalten befinden) keine zusätzlichen berechenbaren Werte, wenn andere X-Spalten vorhanden sind. Das Entfernen von X-Spalten führt möglicherweise zur Anzeige von berechneten y-Werten, die gleichermaßen genau sind. In diesem Fall sollten diese nicht erforderlichen X-Spalten nicht im Regressionsmodell angegebenen werden. Diese Phänomen wird als “Kollinearität" bezeichnet, da jede nicht erforderliche X-Spalte als eine Summe von Vielfachen der erforderlichen X-Spalten formuliert werden kann. Die Funktion RGP überprüft die Spalten auf Kollinearität und entfernt alle nicht erforderlichen X-Spalten aus dem Regressionsmodell, wenn solche ermittelt werden. Entfernte X-Spalten können in der RGP-Ausgabe anhand der Koeffizienten 0 zusätzlich zu den Werten 0 se erkannt werden. Das Entfernen von einer oder mehreren Spalten hat Auswirkungen auf den Freiheitsgrad (df), da dieser von der Anzahl der zur Berechnung verwendeten X-Spalten abhängig ist. Weitere Einzelheiten zur Berechnung von df finden Sie in Beispiel 4. Wird df geändert, da nicht erforderliche X-Spalten gelöscht wurden, wirkt sich dies auch auf die Werte von sey und F aus. Kollinearität sollte in der Praxis nur selten vorkommen. Sie tritt jedoch häufiger auf, wenn einige X-Spalten nur die Werte 0 und 1 enthalten, mit denen angegeben wird, ob ein Objekt in einem Experiment ein Mitglied einer speziellen Gruppe ist oder nicht. Wenn Konstante mit WAHR belegt oder nicht angegeben ist, fügt die RGP-Funktion automatisch eine zusätzliche X-Spalte für alle Werte 1 ein, um den Schnittpunkt zu modellieren. Wenn in einer Spalte durch den Wert 1 angegeben wird, dass das Objekt männlich ist, und durch den Wert 0, dass es nicht männlich ist, und in einer weiteren Spalte durch den Wert 1 angegeben wird, dass das Objekt weiblich ist, und durch den Wert 0, dass es nicht weiblich ist, ist die letzte Spalte nicht erforderlich. Die darin enthaltenen Einträge können berechnet werden, indem der Eintrag in der Spalte, in der angegeben wird, dass ein Objekt männlich ist, von dem Eintrag in der zusätzlichen von der Funktion RGP hinzugefügten Spalte für die Werte 1 subtrahiert wird.
- Der Wert df wird folgendermaßen berechnet, wenn keine X-Spalten aufgrund von Kollinearität aus dem Modell entfernt werden: Wenn k Spalten für X_Werte vorhanden sind und Konstante mit WAHR belegt oder nicht angegeben ist, gilt df = n – k – 1. Wenn Konstante mit FALSCH belegt ist, gilt df = n - k. In beiden Fällen wird der Wert df um die Anzahl der aufgrund von Kollinearität entfernten Spalten erhöht.
- Formeln, die als Ergebnis ein Array zurückgeben, müssen als Arrayformeln eingegeben werden.
- Wird eine Arraykonstante (wie zum Beispiel X_Werte) als Argument eingegeben, müssen Sie Punkte verwenden, um Werte innerhalb derselben Zeile zu trennen, und Semikola, um die Zeilen zu trennen. Die Trennzeichen können entsprechend der Ländereinstellung (in der Systemsteuerung unter Regions- und Sprachoptionen) unterschiedlich sein.
- Beachten Sie, dass mithilfe einer Regressionsgleichung vorhergesagte y-Werte sind möglicherweise ungültig, wenn diese außerhalb des Bereiches der y-Werte liegen, die Sie zur Ermittlung der Gleichung verwendet haben.
- Der zugrunde liegende Algorithmus in der RGP-Funktion unterscheidet sich vom zugrunde liegenden Algorithmus der Funktionen STEIGUNG und ACHSENABSCHNITT. Bei unbestimmten und kollinearen Daten kann der Unterschied zwischen diesen Algorithmen zu unterschiedlichen Ergebnissen führen. Wenn beispielsweise die Datenpunkte des Arguments Y_Werte den Wert 0 und die Datenpunkte des Arguments X_Werte den Wert 1 aufweisen, geschieht Folgendes:
- RGP gibt einen Wert 0 zurück. Der Algorithmus der Funktion RGP soll vernünftige Ergebnisse für kollineare Daten zurückgeben, und in diesem Fall wird mindestens ein Ergebnis ermittelt.
- STEIGUNG und ACHSENABSCHNITT geben den Fehlerwert #DIV/0! zurück. Der Algorithmus der Funktionen STEIGUNG und ACHSENABSCHNITT soll ausschließlich ein einziges Ergebnis ermitteln, und in diesem Fall sind mehrere Ergebnisse möglich.
- Neben der Verwendung von RKB zum Berechnen von Statistiken für andere Regressionstypen können Sie RGP zum Berechnen eines Bereichs von Regressionstypen verwenden, indem Sie Funktionen der x- und y-Variablen als x- und y-Reihen für RGP eingeben. Beispielsweise wird die folgende Formel:
=RGP(Y_Werte, X_Werte^SPALTE($A:$C))
verwendet, wenn Sie über eine Spalte von y-Werten und eine Spalte von x-Werte verfügen, um die kubische (Polynom der Ordnung 3) Annäherung in folgender Form zu berechnen:
y = m1*x + m2*x^2 + m3*x^3 + b
Sie können diese Formel anpassen, um andere Regressionstypen zu berechnen. In einigen Fällen ist dafür die Anpassung der Ausgabewerte und anderer Statistiken erforderlich.
Beispiel 1
Steigung und y-Achsenabschnitt
Möglicherweise wird das Beispiel verständlicher, wenn Sie es in ein leeres Arbeitsblatt kopieren.
Wie kopiere ich ein Beispiel?
- Markieren Sie das Beispiel in diesem Artikel. Falls Sie das Beispiel in Excel Web App kopieren möchten, müssen Sie es jeweils zellenweise kopieren und einfügen.
Wichtig Markieren Sie dabei nicht die Zeilen- oder Spaltenüberschriften.
Auswählen eines Beispiels aus der Hilfe
- Drücken Sie STRG+C.
- Erstellen Sie eine leere Arbeitsmappe oder ein leeres Arbeitsblatt.
- Markieren Sie im Arbeitsblatt Zelle A1, und drücken Sie STRG+V. Wenn Sie in Excel Web App arbeiten, wiederholen Sie das Kopieren und Einfügen bei jeder Zelle im Beispiel.
Wichtig Damit das Beispiel ordnungsgemäß funktioniert, müssen Sie es in Zelle A1 des Arbeitsblatts einfügen.
- Zum Wechseln zwischen der Anzeige der Ergebnisse und der Anzeige der Formeln, die das Ergebnis liefern, drücken Sie STRG+` (Graviszeichen), oder klicken Sie auf der Registerkarte Formeln in der Gruppe Formelüberwachung auf die Schaltfläche Formeln anzeigen.
Nachdem Sie das Beispiel in ein leeres Arbeitsblatt kopiert haben, können Sie es Ihren Anforderungen entsprechend anpassen.
|
|
| A |
B |
C |
| y-Wert |
x-Wert |
|
| 1 |
0 |
|
| 9 |
4 |
|
| 5 |
2 |
|
| 7 |
3 |
|
| Formel |
Formel |
Ergebnis |
| =RGP(A2:A5;B2:B5;;FALSCH) |
|
A7=2, B7=1 |
|
Wichtig Die Formel in dem Beispiel muss als Arrayformel eingegeben werden. Markieren Sie nach dem Kopieren des Beispiels in ein leeres Arbeitsblatt den Bereich A7:B7 beginnend mit der Formelzelle. Drücken Sie F2 und anschließend STRG+UMSCHALT+EINGABETASTE. Wird die Formel nicht als Arrayformel eingegeben, ist das einzelne Ergebnis 2.
Wird die Formel als ein Array eingegeben, werden die Steigung (2) und der y-Achsenabschnitt (1) zurückgegeben.
Beispiel 2
Einfache lineare Regression
Möglicherweise wird das Beispiel verständlicher, wenn Sie es in ein leeres Arbeitsblatt kopieren.
Wie kopiere ich ein Beispiel?
- Markieren Sie das Beispiel in diesem Artikel. Falls Sie das Beispiel in Excel Web App kopieren möchten, müssen Sie es jeweils zellenweise kopieren und einfügen.
Wichtig Markieren Sie dabei nicht die Zeilen- oder Spaltenüberschriften.
Auswählen eines Beispiels aus der Hilfe
- Drücken Sie STRG+C.
- Erstellen Sie eine leere Arbeitsmappe oder ein leeres Arbeitsblatt.
- Markieren Sie im Arbeitsblatt Zelle A1, und drücken Sie STRG+V. Wenn Sie in Excel Web App arbeiten, wiederholen Sie das Kopieren und Einfügen bei jeder Zelle im Beispiel.
Wichtig Damit das Beispiel ordnungsgemäß funktioniert, müssen Sie es in Zelle A1 des Arbeitsblatts einfügen.
- Zum Wechseln zwischen der Anzeige der Ergebnisse und der Anzeige der Formeln, die das Ergebnis liefern, drücken Sie STRG+` (Graviszeichen), oder klicken Sie auf der Registerkarte Formeln in der Gruppe Formelüberwachung auf die Schaltfläche Formeln anzeigen.
Nachdem Sie das Beispiel in ein leeres Arbeitsblatt kopiert haben, können Sie es Ihren Anforderungen entsprechend anpassen.
|
|
| A |
B |
C |
| Monat |
Umsatz |
|
| 1 |
3100 |
|
| 2 |
4500 |
|
| 3 |
4400 |
|
| 4 |
5400 |
|
| 5 |
7500 |
|
| 6 |
8100 |
|
| Formel |
Beschreibung |
Ergebnis |
| =SUMME(RGP(B2:B7; A2:A7)*{9;1}) |
Geschätzter Umsatz für den neunten Monat |
11000 |
|
Im Allgemeinen ist SUMME({m;b}*{x;1}) gleich mx + b. Dies ist der geschätzte y-Wert eines gegebenen x-Werts. Sie können hierfür auch die TREND-Funktion verwenden.
Beispiel 3
Multiple lineare Regression
Angenommen, eine Immobilienfirma plant, mehrere Bürogebäude zu kaufen, die in einem gut eingeführten Geschäftsviertel stehen.
Ausgehend von den in der folgenden Tabelle zusammengestellten Variablen kann die Firma mithilfe der multiplen linearen Regressionsanalyse abschätzen, welchen Wert ein in einer bestimmten Gegend stehendes Bürogebäude hat.
| Variable |
Beschreibt |
| y |
den geschätzten Wert eines Bürogebäudes |
| x1 |
die Grundfläche in Quadratmetern |
| x2 |
Anzahl der Büros |
| x3 |
Anzahl der Eingänge |
| x4 |
das Alter des Bürogebäudes in Jahren |
Für dieses Beispiel wird angenommen, dass zwischen den unabhängigen Variablen (x1, x2, x3 und x4) und der abhängigen Variablen (y), die jeweils den Wert eines in der fraglichen Umgebung stehenden Bürogebäudes angibt, eine lineare Beziehung besteht.
Die Immobilienfirma wählt aus 1500 möglichen Bürogebäuden nach dem Zufallsprinzip stichprobenweise 11 Bürogebäude und erhält die folgenden Daten: "Halber Eingang" bedeutet, dass nur ein Lieferanteneingang vorhanden ist.
Möglicherweise wird das Beispiel verständlicher, wenn Sie es in ein leeres Arbeitsblatt kopieren.
Wie kopiere ich ein Beispiel?
- Markieren Sie das Beispiel in diesem Artikel. Falls Sie das Beispiel in Excel Web App kopieren möchten, müssen Sie es jeweils zellenweise kopieren und einfügen.
Wichtig Markieren Sie dabei nicht die Zeilen- oder Spaltenüberschriften.
Auswählen eines Beispiels aus der Hilfe
- Drücken Sie STRG+C.
- Erstellen Sie eine leere Arbeitsmappe oder ein leeres Arbeitsblatt.
- Markieren Sie im Arbeitsblatt Zelle A1, und drücken Sie STRG+V. Wenn Sie in Excel Web App arbeiten, wiederholen Sie das Kopieren und Einfügen bei jeder Zelle im Beispiel.
Wichtig Damit das Beispiel ordnungsgemäß funktioniert, müssen Sie es in Zelle A1 des Arbeitsblatts einfügen.
- Zum Wechseln zwischen der Anzeige der Ergebnisse und der Anzeige der Formeln, die das Ergebnis liefern, drücken Sie STRG+` (Graviszeichen), oder klicken Sie auf der Registerkarte Formeln in der Gruppe Formelüberwachung auf die Schaltfläche Formeln anzeigen.
Nachdem Sie das Beispiel in ein leeres Arbeitsblatt kopiert haben, können Sie es Ihren Anforderungen entsprechend anpassen.
| |
1 |
| 2 |
| 3 |
| 4 |
| 5 |
| 6 |
| 7 |
| 8 |
| 9 |
| 10 |
| 11 |
| 12 |
| 13 |
14 |
|
| A |
B |
C |
D |
E |
| Grundfläche (x1) |
Büroräume (x2) |
Eingänge (x3) |
Alter (x4) |
Schätzwert (y) |
| 2310 |
2 |
2 |
20 |
142.000 |
| 2333 |
2 |
2 |
12 |
144.000 |
| 2356 |
3 |
1,5 |
33 |
151.000 |
| 2379 |
3 |
2 |
43 |
150.000 |
| 2402 |
2 |
3 |
53 |
139.000 |
| 2425 |
4 |
2 |
23 |
169.000 |
| 2448 |
2 |
1,5 |
99 |
126.000 |
| 2471 |
2 |
2 |
34 |
142.900 |
| 2494 |
3 |
3 |
23 |
163.000 |
| 2517 |
4 |
4 |
55 |
169.000 |
| 2540 |
2 |
3 |
22 |
149.000 |
| Formel |
|
|
|
|
| =RGP(E2:E12; A2:D12; WAHR; WAHR) |
|
|
|
|
|
Wichtig Die Formel im Beispiel muss als Arrayformel eingegeben werden. Wählen Sie nach dem Kopieren des Beispiels in ein leeres Arbeitsblatt den Bereich A14:E18 aus, beginnend mit der Formelzelle. Drücken Sie F2 und dann STRG+UMSCHALT+EINGABE. Wird die Formel nicht als Arrayformel eingegeben, lautet das einzige Ergebnis -234,2371645.
Werden die oben genannten Werte in Form eines Arrays eingegeben, werden die nachstehenden Regressionskenngrößen geliefert. Verwenden Sie den folgenden Schlüssel zur Identifizierung der gewünschten Kenngröße.
Mit den in Zeile 14 enthaltenen Werten kann die Gleichung für die multiple lineare Regression (y = m1*x1 + m2*x2 + m3*x3 + m4*x4 + b) formuliert werden:
y = 27,64*x1 + 12.530*x2 + 2.553*x3 - 234,24*x4 + 52.318
Die Immobilienfirma kann jetzt den Schätzwert eines 25 Jahre alten Bürogebäudes ermitteln, das in demselben Geschäftsviertel steht, eine Grundfläche von 2.500 Quadratmetern hat, drei Büros umfasst und zwei Eingänge hat. Dazu verwendet die Firma folgende Gleichung:
y = 27,64*2500 + 12530*3 + 2553*2 - 234,24*25 + 52318 = 158.261 Euro
Sie können auch die folgende Tabelle in Zelle A21 des Arbeitsblatts kopieren, das Sie für dieses Beispiel erstellt haben.
| Grundfläche (x1) |
Büroräume (x2) |
Eingänge (x3) |
Alter (x4) |
Schätzwert (y) |
| 2500 |
3 |
2 |
25 |
=D14*A22 + C14*B22 + B14*C22 + A14*D22 + E14 |
Sie können diesen Wert auch unter Verwendung der TREND-Funktion berechnen.
Beispiel 4
Verwendung der F- und r2-Statistiken
In dem vorherigen Beispiel hat das Bestimmtheitsmaß (oder r2) den Wert 0,99675 (siehe Zelle A17 in der von RGP erzeugten Ausgabe). Dieser Wert steht für einen engen Zusammenhang zwischen den unabhängigen Variablen und dem jeweiligen Verkaufspreis. Mithilfe der F-Statistik können Sie prüfen, ob diese Ergebnisse mit einem derart großen Bestimmtheitsmaß (r2) zufällig sind oder nicht.
Stellen Sie dazu die Hypothese auf, dass zwischen den Variablen eigentlich kein Zusammenhang besteht, sondern dass Sie nur zufällig eine Stichprobe von 11 Bürogebäuden erhoben haben, für die die statistische Analyse einen starken Zusammenhang anzeigt. Um die Wahrscheinlichkeit zu beschreiben, mit der irrtümlich ein Zusammenhang ermittelt wird, wird die Irrtumswahrscheinlichkeit "Alpha" verwendet.
Die in der Ausgabe der RGP-Funktion enthaltenen Werte für F und df können verwendet werden, um die Wahrscheinlichkeit eines zufällig auftretenden höheren F-Werts zu bewerten. F kann mit kritischen Werten in veröffentlichten Tabellen zur F-Verteilung verglichen werden. Sie können auch die FVERT-Funktion in Excel verwenden, um die Wahscheinlichkeit eines zufällig auftretenden höheren F-Werts zu berechnen. Die entsprechende F-Verteilung hat die Freiheitsgrade v1 und v2. Wenn n die Anzahl der Datenpunkte ist und "Konstante" mit WAHR belegt oder nicht angegeben ist, gilt v1 = n – df – 1 und v2 = df. (Wenn "Konstante" mit FALSCH belegt ist, gilt v1 = n – df und v2 = df.) Die FVERT-Funktion (mit der Syntax FVERT(F;v1;v2) gibt die Wahrscheinlichkeit eines zufällig auftretenden höheren F-Werts zurück. In diesem Beispiel ist df = 6 (Zelle B18) und F = 459,753674 (Zelle A18).
Angenommen, als Alpha-Quantil wird 0,05 verwendet, v1 = 11 – 6 – 1 = 4 und v2 = 6, dann liegt das kritische Niveau von F bei 4,53. Da F = 459,753674 viel größer ist als 4,53, ist es sehr unwahrscheinlich, dass zufällig ein so hoher F-Wert auftritt. (Wird Alpha = 0,05 verwendet, ist die Hypothese, dass kein Zusammenhang zwischen Y_Werte und X_Werte besteht, ungültig, wenn F das kritische Niveau (4,53) überschreitet. Mithilfe der FVERT-Funktion in Excel können Sie die Wahrscheinlichkeit berechnen, dass zufällig so ein hoher Wert auftritt. Bei FVERT(459,753674. 4. 6) = 1.37E-7 ist beispielsweise die Wahrscheinlichkeit sehr gering. Sie werden (entweder durch Ermitteln des kritischen Niveaus von F in einer Tabelle oder mithilfe der FVERT-Funktion) feststellen, dass die Regressionsgleichung beim Berechnen des bewerteten Werts von Bürogebäuden in diesem Gebiet hilfreich ist. Beachten Sie jedoch, dass Sie auf jeden Fall die korrekten Werte für v1 und v2 verwenden, die im vorherigen Abschnitt berechnet wurden.
Beispiel 5
Berechnen der t-Statistik
Mithilfe einer anderen Hypothese kann festgestellt werden, ob die einzelnen Steigungskoeffizienten geeignet sind, den Schätzwert eines der in Beispiel 3 aufgeführten Bürogebäude zu berechnen. Um zum Beispiel den Koeffizienten für das Gebäudealter bezüglich der statistischen Wahrscheinlichkeit (Sicherheit) zu prüfen, dividieren Sie –234,24 (Steigungskoeffizient für das Alter) durch 13,268 (der in Zelle 15 stehende Standardfehler des Alterskoeffizienten). Daraus ergibt sich der folgende t-Wert:
t = m4 ÷ se4 = -234,24 ÷ 13,268 = -17,7
Wenn der Absolutwert von t hoch genug ist, kann geschlussfolgert werden, dass der Steigungskoeffizient für die Berechnung des bewerteten Werts eines Bürogebäudes in Beispiel 3 hilfreich ist. In der folgenden Tabelle sind die Absolutwerte der vier berechneten t-Werte dargestellt.
Wenn Sie die entsprechende Tabelle eines Statistikhandbuchs zu Rate ziehen, werden Sie feststellen, dass der kritische t-Wert bei einem zweiseitigen Test mit sechs Freiheitsgraden und Alpha = 0,05 den Wert 2,447 hat. Dieser kritische Wert kann auch mithilfe der TINV-Funktion in Excel ermittelt werden. TINV(0,05.6) = 2,447. Da der Absolutwert von t (17,7) größer als 2,447 ist, ist Alter eine zuverlässige Variable, um den Schätzwert eines Bürogebäudes zu ermitteln. Für alle weiteren unabhängigen Variablen kann die statistische Wahrscheinlichkeit auf dieselbe Weise geprüft werden. Für die anderen unabhängigen Variablen werden die folgenden t-Werte ermittelt:
| Variable |
Berechneter t-Wert |
| Grundfläche |
5,1 |
| Anzahl der Büros |
31,3 |
| Anzahl der Eingänge |
4,8 |
| Alter |
17,7 |
Alle Werte haben einen Absolutwert, der größer als 2,447 ist. Daher sind alle Variablen, die in der Regressionsgleichung verwendet werden, geeignet, den Schätzwert eines zum fraglichen Büroviertel gehörenden Bürogebäudes zu bestimmen.