C - Darstellung der empirischen Untersuchung zur Markentreue

23. Mai 201523. Mai 2018

Vorwort zur empirische Untersuchung Markentreue

Nachdem die Zusammenhänge und die Problemstellung in den letzten Kapiteln theoretisch abgeleitet wurden, soll nun ein empirisches Design entworfen und getestet werden, um die grundlegenden Hypothesen des dargestellten Konzeptes zu bestätigen.

23. Mai 201523. Mai 2018

Gütekriterien der Messung

Die Befragung durch Fragebogen ist eine Messung. Auf die praktische Bedeutung von Messungen bezogen, müssen diese vor allem objektiv, vergleichbar, ökonomisch und nützlich sein.[1] Diese Gütekriterien sind nur schwierig zu überprüfen. Aus statistischer Perspektive sind zwei weitere Gütekriterien wichtiger, die durch statistische Prüfungen zu belegen sind: Validität und Reliabilität. Reliabilität ist gemäß der klassischen Testtheorie definiert, als der Quotient der Varianz der wahren Werte und der Varianz der beobachteten Werte.[2] Die Reliabilität ist ein Maß dafür, inwieweit die gemessenen Werte mit den tatsächlichen Werten übereinstimmen. Demgegenüber ist die Validität ein Maß dafür, inwieweit das Meßinstrument wirklich das mißt, was es messen soll.

Um die Konstruktvalidität der Variablen zu überprüfen, wurde nach angemessenen Recodierungen, eine „näherungsweise“ konfirmatorische Faktorenanalyse durchgeführt, indem alle Indikatoren, die Bestandteil eines Konstruktes werden sollen, in eine gemeinsame Faktorenanalyse eingegeben wurden.[3]

Die Konstrukte Reizbedürfnis, Abwechslungsaffekt, Risikotoleranz und ursprüngliches Abwechslungspotential konnten aufgrund dieser Faktorenanalyse als relativ valide bewertet werden. Durch eine weitere Faktorenanalyse mit den übrigen Indikatoren konnten trotz teilweise erheblicher Fehlladungen, die vermutlich auf mangelhafte Operationalisierung zurückzuführen sind, die Konstrukte Involvement und ursprüngliches Risikopotential bestätigt werden. Problematisch verhalten sich die Ladungen bei dem Konstrukt Konsequenzen und hier vor allem die von RIAFFSOZ und RIAFFPHY. Da dieses Konstrukt noch aus einer ganzen Reihe weiterer Items besteht, soll für diese Arbeit trotzdem an dem Konstrukt Risikoaffekt festgehalten werden. GESAFF_X zeigt hohe Ladungen auf mehreren verschiedenen Faktoren. Bei der Zuordnung der Items aufgrund der jeweils höchsten Ladung, teilen sich die Items auf zwei Faktoren auf. Die Operationalisierung des Gesamtaffektes ist damit als unsicher zu bezeichnen.

Eine weitere Unstimmigkeit tauchte bei den Konstrukten Gewöhnung und Unsicherheit auf. Beide Konstrukte zeigten sehr hohe Ladungen auf dem gleichen Faktor. Dieser Sachverhalt kann theoretisch interpretiert werden, da eine sehr hohe Abhängigkeit zwischen Unsicherheit und Gewöhnung besteht. Je größer die Gewöhnung ist, desto geringer wird tendenziell die empfundene Unsicherheit sein. Umgekehrt wird mit großer wahrgenommener Unsicherheit das Gefühl von Gewöhnung eher gering sein. Beide Konstrukte werden weitgehend ohne affektive Bewertung ermittelt. Trotz dieser Überschneidung werden Unsicherheit und Gewöhnung im weiteren als zwei getrennte Konstrukte behandelt.

Die „rotated factor matrix“ ist im Anhang abgedruckt. Dort können die hier abgeleiteten Ergebnisse nachvollzogen werden.

Als Reliabilitätsmaß der Messung wird der Koeffizient „Cronbachs Alpha“, der ein Maß für die interne Konsistenz einer Skala darstellt, ermittelt. Die Reliabilitätskoeffizienten können der folgenden Tabelle entnommen werden. Weitere Informationen sind im Anhang abgedruckt. Jede Skala setzt sich zunächst aus den Items zusammen, die oben zu den entsprechenden Konstrukten genannt wurden. Um die Reliabilität zu erhöhen, wurden, nach inhaltlicher Überprüfung, teilweise Items aus der Skala ausgeschlossen und der Reliabilitätskoeffizient danach erneut berechnet.

Skala (Konstrukt)	alpha
Abwechslungsaffekt (ABWAFF_X)	.8567
ursprüngliches Abwechslungspotential (ABWPOURX)	.8249
Gesamtaffekt (GESAFF_X)	.6667
Gewöhnung (GEWOEH_X)	.7296
Gewöhnung (GEWOEH_X ohne GEWOEH_3)	.7621
Involvement (INVOLV_X)	.6593
Involvement (INVOLV_X ohne INVOLV_1)	.7077
ursprüngliches Risikopotential (KONURS_X)	.6777
Reizbedürfnis (REIZBEX1)	.9549
Konsequenzen (KONSEQ_X)	.7481
Risikotoleranz (RISLUSX1)	.7906
Unsicherheit (UNSICH_X)	.0981
Unsicherheit (UNSICH_X ohne UNSICH_4 und UNSICH_5)	.7777
Wiederkaufwahrscheinlichkeit (WKW_X)	.6316

Tab. 1 (Cronbachs Alpha)

Ab welcher Höhe des Testwertes „Cronbachs Alpha“, das getestete Meßinstrument als reliabel zu bezeichnen ist, ist nicht eindeutig festgelegt. Üblicherweise werden Koeffizienten von .7 bis .8 als ausreichend angesehen. In der Praxis werden häufig weit geringere Koeffizienten noch akzeptiert.[4] Nach dieser Maßgabe können alle Skalen bis auf WKW_X, GESAFF_X und KONURS_X auf jeden Fall als reliabel eingestuft werden. Bei der Interpretation ist jedoch zu berücksichtigen, daß die Höhe von Cronbachs Alpha mit steigender Itemzahl einer Skala ansteigt. Bedenkt man dies,deuten die relativ niedrigen Koeffizienten der Skalen WKW_X, GESAFF_X und KONURS_X die aus nur 4, bzw. 6 Items bei KONURS_X gebildet wurden, doch auf eine ausreichende innere Konsistenz hin. Alle drei Konstrukte verbleiben deshalb in der Auswertung.

[1] vgl.: Schnell, R.;Hill, P.B.; Esser, E. (1993), S. 158

[2] vgl.: Schnell, R.;Hill, P.B.; Esser, E. (1993), S. 158

[3] vgl.: Schnell, R.;Hill, P.B.; Esser, E. (1993), S. 174 und Bortz, J., (1993), S. 518

[4] vgl.: Schnell, R.;Hill, P.B.; Esser, E. (1993), S. 161

23. Mai 201523. Mai 2018

Aufbereitung der Daten

Im Anschluß an die Variablendefinition, die Recodierung aufgrund falscher Orientierung der Items im Fragebogen und die Validitäts- und Reliabilitätsuntersuchungen, wurden folgende mathematische Definitionen für die einzelnen Konstrukte als statistisch sinnvoll erachtet und entsprechende Transformationen durchgeführt. Im Anschluß daran sind noch einige Recodierungen vorgenommen worden, die später die Auswertung der Ergebnisse vereinfachen sollen.

Gewöhnung:

gewoeh_x = (gewoe_1+gewoe_2+gewoe_4)/3

Risikoaffekt:

unsich_x = (unsich_1+unsich_3+unsich_2)/3

konseq_X = (((riaffzei+riafffin+RIAFF__1+RIAFF__2+RIAFFQU1+

RIAFFQU2+riaffphy+riaffpsy +riaffsoz)/9)*riaffgew)/7

risiko_x = konseq_x*unsich_x/7

Abwechslungsaffekt:

abwaff_x = (abwaff_1+abwaff_2+abwaff_3+abwaff_4+abwaff_5+

abwaff_6+abwaff_7+abwaff_8+abwaff_9)/9

ursprüngliches Abwechslungspotential:

abwpourx = (abwpour1+abwpour2+abwpour3+abwpour4)/4

ursprüngliches Risikopotential:

konurs_x = (konfinur+konphyur+konpsyur+konquaur

+konsozur+konzeiur)/6

Involvement:

INVOLV_X = (involv_4+involv_2+involv_3)/3 .

Gesamteffekt:

gesaff_x = (gesaff_1+gesaff_2+gesaff_3+gesaff_4)/4

Die Variablen für die Risikotoleranz und das Reizbedürfnis kommen durch jeweils eine Faktoranalyse zustande und werden folgendermaßen benannt:

Risikotoleranz: RISLUSX1

Reizbedürfnis: REIZBEX1

Wiederkaufwahrscheinlichkeit:

wkw_x = (wkw1+wkw4+wkw2+wkw3)/4

Drehen der Kurve der Abwechslungsaffekte:

abwaff2x = 8-abwaff_x

Drehen der Kurve der Risikoaffekte:

risiko2x = risiko_x-7

Skalentransformation (Logarithmieren der Gewöhnung):

gewtr_1 = LG10(gewoeh_x)

Skalentransformation (Quadrieren der Gewöhnung):

gewtr_2 = gewoeh_x ** 2

Addieren von Abwechslungs- und Risikoaffekt:

sumaff_x = abwaff2x+risiko2x

Gesamtaffekt minus Risikoaffekt:

abafkonx = gesaff_x-risiko2x

23. Mai 201523. Mai 2018

Vorwort Überprüfung der Untersuchungshypothesen

Bei den aufgestellten Hypothesen handelt es sich um Zusammenhangshypothesen. Diese werden sämtlich im folgenden mit Hilfe von Regressionsmodellen überprüft. In einigen Fällen handelt es sich um nichtlineare Zusammenhänge. Auf Anraten eines Spezialisten[1] wurden die Daten so transformiert, daß eine lineare Regression vorgenommen werden konnte. Auch nach dieser Transformation sind die durchzuführenden Tests noch aussagekräftig oder können zumindest als Approximation angesehen werden. Auf jeden Fall ist die Anwendung des linearen Regressionsmodells für die Zwecke einer inhaltlichen Arbeit ausreichend. Nichtlineare Regression ist für dieses Anwendungsgebiet übertrieben aufwendig, vielmehr eher für ökonometrische Zwecke geeignet und außerdem mit SPSS nicht befriedigend durchzuführen. Auch Bortz behandelt die nichtlineare Regression und vor allem deren inferenzstatistische Absicherung nur am Rande, da er sie als sehr komplex einstuft.[2]

Aufgrund der theoretischen Ausführungen und der Hypothesenformulierung wäre ein „Herauspartialisieren“ einzelner Variablen die eleganteste Lösung gewesen. Aufgrund von Hinweisen von Dr. Blasius wurde von diesem Verfahren jedoch abgesehen und die eigentlich „herauszupartialisierenden“ Faktoren mit in die multiple Regression hereingenommen. Mathematisch ist das Ergebnis äquivalent, da bei der multiplen Regression jeweils alle bis auf einen Regressor gleich null gesetzt werden. Darüber hinaus wird die multiple Regression von SPSS besser unterstützt als das „Herauspartialisieren“.

Folgende Regressionen wurden durchgeführt:

1.a Regressoren: ABWPOURX Regressand: ABWAFF2X

REIZBEX1

GEWTR_1

1.b Regressoren: ABWPOURX Regressand: ABWAFF2X

REIZBEX1

GEWTR_1

INVOLV_X

(GEWTR_1 ist die transformierte Variable GEWOEH_X. Zu diesem Zweck wurden die Daten logarithmiert.)

2.a Regressoren: KONURS_X Regressand: RISIKO2X

RISLUSX1

GEWTR_2

2.b Regressoren: KONURS_X Regressand: RISIKO2X

RISLUSX1

GEWTR_2

INVOLV_X

(GEWTR_2 ist die transformierte Variable GEWOEH_X. Zu diesem Zweck wurden die Daten ins Quadrat gesetzt. Zwar konnte durch diese Transformation nicht die Bedingung erfüllt werden, daß die zweite Ableitung zweiten Grades ist, aus der graphischen Darstellung des Konzeptes wird jedoch deutlich, daß diese Bedingung nicht so entscheidend ist. Außerdem müßte für eine entsprechende Transformation der Wert bekannt sein, ab dem das Gefälle der Kurve überproportional zunimmt. Diese Information kann aus den vorliegenden Daten nicht entnommen werden. Ansonsten werden die mathematischen Vorgaben durch diese Transformation erfüllt.)

3. Regressoren: SUMAFF_X Regressand: GESAFF_X

(SUMAFF_X ist gleich der Summe aus ABWAFF2X und RISIKO2X.)

4. Regressoren: SUMAFF_X Regressand: WKW_X

(Bei der Durchführung dieser Regression wurden zuvor mit der Bedingung „EXTRI_3 ne 1“ die Daten herausgefiltert, die aufgrund einer extrinsischen Motivation keine zufriedenstellenden Ergebnisse erwarten ließen. In die Analyse gingen daraufhin 38 Frauen und 50 Männer ein.)

5. Regressoren: GESAFF_X Regressand: WKW_X

6. Regressoren: ABWPOURX Regressand: ABAFKONX

REIZBEX1

GEWTR_1

Alle Auswertungen wurden jeweils getrennt nach Geschlechtern durchgeführt. Kurzversionen der Outputs sind im Anhang zu finden. Die nicht explizit im folgenden besprochenen Parameter können dort nachgelesen werden.

[1] Dr. J. Blasius, Mitarbeiter im Zentralarchiv für empirische Sozialforschung war so freundlich, sich für mich Zeit zu nehmen und mich bezüglich der Auswertung der Daten zu beraten.

[2] vgl.: Bortz, J., (1993), S. 187

23. Mai 201523. Mai 2018

Spezifizierung des Modells

Grundsätzlich ist die Voraussetzung für die Durchführung der Regressionsanalyse, daß das Regressionsmodell korrekt spezifiziert ist. Wenn dies nicht der Fall ist, dann ist von vornherein keine Abhängigkeit zu erwarten oder gefundene Abhängigkeiten können Artefakte sein. Zur Aufstellung eines Regressionsmodells ist also eine umfangreiche Vorarbeit notwendig.

Bei allen oben dargestellten Modellen wird aufgrund der umfangreichen theoretischen Vorarbeiten davon ausgegangen, daß sie korrekt spezifiziert sind. Dabei steht fest, wie schon am Anfang der Untersuchung ausgeführt wurde, daß ein Verhalten oder auch eine Einstellung von einer unübersehbar großen Anzahl von Faktoren beeinflußt wird. Diese konnten und sollten nicht alle Gegenstand dieser Untersuchung sein. „Eine vollständige Modellformulierung setzt im Prinzip das Vorhandensein erschöpfenden theoretischen Wissens über den untersuchten Zusammenhang voraus. Dieses ist jedoch aus wissenschaftstheoretischen Überlegungen heraus prinzipiell niemals möglich, sodaß das Postulat der Vollständigkeit immer nur als Leitidee zu verstehen ist.“[1]

Auf der anderen Seite wird aufgrund der theoretischen Vorarbeiten davon ausgegangen, daß die Faktoren, die mit in das Modell einbezogen wurden, einen Erklärungsgehalt für dasselbe haben.

[1] Backhaus, K.; Erichson, B.; Plinke, W.; Weiber, R., (1994), S. 31

23. Mai 201523. Mai 2018

Skalenniveau

Die Anwendung der Kleinst-Quadrate-Schätzung im Rahmen der Regressionsanalyse, setzt sowohl für die abhängige, als auch für die unabhängigen Variablen metrisches Skalennivau voraus.

Die im Fragebogen hauptsächlich verwendeten Rating-Skalen können nicht grundsätzlich als Intervallskalen, also als metrische Skalen bezeichnet werden. Es ist jedoch üblich von diesen anzunehmen, sie seien intervallskaliert und sie dann auch entsprechend zu behandeln.[1] „Hinter dieser ‚liberalen‘ Auffassung steht die Überzeugung, daß die Bestätigung einer Forschungshypothese durch die Annahme eines falschen Skalenniveaus eher erschwert wird.“[2] Dies ist in dieser Untersuchung umso berechtigter, als durch Verbindung mehrerer Items, von denen einige Intervallskalenniveau haben, die Annahme der Intervallskalierung noch bestärkt wird.

Bei den folgenden Untersuchungen wird deshalb davon ausgegangen, daß die verwendeten Daten intervallskalliert sind.

[1] vgl.: Backhaus, K.; Erichson, B.; Plinke, W.; Weiber, R. (1994), S. XIV

[2] Bortz, J., (1993), S. 27

23. Mai 201523. Mai 2018

Test auf Autokorrelation und Heteroskedastizität

Ein wichtiger Bestandteil der Regressionsanalyse sind die Residuen. Diese müssen eine ganze Reihe von Bedingungen erfüllen, damit die Schätzungen durch die Regressionsanalyse effizient sind.

Eine Prämisse des Regressionsmodells fordert, daß die Residuen, die ihre Ursache in den Störgrößen haben, nicht miteinander korrelieren. Wenn diese Prämisse nicht erfüllt ist, sprechen wir von Autokorrelation. Bei Zeitreihenanalysen gibt es eine sinnvolle Reihenfolge der Daten, wodurch zum Beispiel eine serielle Korrelation leicht nachgewiesen werden kann. Bei Querschnittsdaten ist die Reihenfolge der Fälle beliebig. „Das führt dazu, daß dort vorhandene Korrelationen kaum zu identifizieren sind.“[1] Aus diesem Grunde wird der Durbin/Watson-Test-Wert, der als Maßzahl der Autokorrelation üblich ist nicht berechnet. Dieser Test hat die Reihenfolge der Residuen der Beobachtungswerte zum Gegenstand der Analyse. Die Ausgangsdaten können aber durch Umstellung der Fälle beliebig geändert werden. Da die Reihenfolge der Eingabe der einzelnen Fälle rein zufällig erfolgte, hätte der Durbin/Watson-Test keine Aussagekraft. Es wird aus diesem Grunde angenommen, daß keine Autokorrelation besteht.

Eine weitere Voraussetzung des Regressionsmodells ist, daß die Varianz der Residuen homogen ist, das heißt, daß keine Heteroskedastizität vorliegt. Mit anderen Worten bedeutet dies, daß die Residualgröße nicht vom Betrag oder der Reihenfolge der Beobachtungen der unabhängigen Variablen beeinflußt werden darf.[2] Um diese Bedingung überprüfen zu können, eignen sich die standardisierten und studentisierten Residuen am besten.[3] Sowohl Backhaus[4], als auch Kockläuner[5] schlagen in erster Linie die Überprüfung dieser Bedingung mit Hilfe graphischer Hilfsmittel vor.

Wie oben schon ausgeführt, kann eine Abhängigkeit von der Reihenfolge der Beobachtungen ausgeschlossen werden. Zu überprüfen bleibt eine unter Umständen vorhandene Abhängigkeit vom Betrag. Die studentisierten Residuenwerte sind aufgrund ihrer Konstruktion mit den Vorhersagewerten leicht korreliert. Dies stört in diesem Fall jedoch nicht, da es nur darauf ankommt, daß die Residuenwerte mit konstanter Streuung zufällig um Null verteilt sind. Wenn sich in einem Streudiagramm eine abhängig von den Vorhersagewerten variierende Streuung der studentisierten Residuen findet, dann deutet das auf eine Verletzung der Annahme von Homoskedastizität hin.[6]

Sämtliche Diagramme zu den oben angegebenen Regressionen wurden überprüft. Keines der Streudiagramme läßt eine deutliche Abhängigkeit der Varianz von den Vorhersagewerten erkennen. Damit gilt die Bedingung der Homoskedastizität für alle Regressionsmodelle als erfüllt.

[1] Kockläuner, Gerhard, (1988), S. 70

[2] Backhaus, K.; Erichson, B.; Plinke, W.; Weiber, R. (1994), S. 35

[3] vgl.: Kockläuner, Gerhard, (1988), S. 67

[4] vgl.: Backhaus, K.; Erichson, B.; Plinke, W.; Weiber, R., (1994), S. 35

[5] vgl.: Kockläuner, Gerhard, (1988), S. 67

[6] vgl.: Kockläuner, Gerhard, (1988), S. 67

23. Mai 201523. Mai 2018

Test auf Multikollinearität

Eine weitere Voraussetzung für die Anwendbarkeit des Regressionsmodells ist die Abwesenheit von Multikollinearität zwischen den unabhängigen Variablen. Das bedeutet, daß sich ein Regressor nicht als Linearkombination der übrigen Regressoren darstellen lassen darf. Multikollinearität wird erst dann zum Problem, wenn eine starke lineare Abhängigkeit zwischen den Regressoren besteht.[1] Bei zwei Regressoren reicht es aus, anhand der Korrelationsmatrix zu überprüfen, ob Korrelationen bestehen. Bei drei oder mehr Regressoren läßt sich dieses Kriterium durch die Auswertung der Toleranzen der Regressoren klären. Diese berechnen sich aus: 1-Bestimmtheitsmaß einer Regressionsanalyse aller unabhängigen Variablen mit der jeweils zu untersuchenden unabhängigen Variablen als Regressand und den übrigen unabhängigen Variablen als Regressoren. Toleranzen nahe null deuten auf eine Multikollinearität der unabhängigen Variablen der eigentlichen Regressionsanalyse hin.[2]

weiblich

männlich

Regression

Regressoren

Toleranz

1.a

GEWTR_1

ABWPOURX

REIZBEX1

.963218

.961361

.914029

.983572

.909303

1.b

GEWTR_1

ABWPOURX

REIZBEX1

INVOLV_X

.833641

.940086

.957451

.814981

.784801

.967400

.904410

.765636

2.a

GEWTR_2

KONURS_X

RISLUSX1

.972883

.990093

.974331

.956431

.992608

.949542

2.b

GEWTR_2

KONURS_X

RISLUSX1

INVOLV_X

.701395

.988905

.962020

.720584

.786629

.991166

.945452

.803569

GEWTR_1

ABWPOURX

REIZBEX1

.963218

.993834

.961361

.914029

.983572

.909303

Tab. 2 (Toleranzen)

„Eine exakte Grenze für ‚ernsthafte Multikollinearität‘ läßt sich nicht angeben.“[3] Bei derart hohen Werten, wie sie sich in der oben abgedruckten Übersicht finden, kann eine starke Kollinearität ausgeschlossen werden. Auffällig sind lediglich die Werte des Involvements und die Werte der Gewöhnung, wenn das Involvement mit in die Untersuchung einbezogen wird. Im weiteren wird davon ausgegangen, daß keine Multikollinearität zwischen den unabhängigen Variablen besteht.

[1] vgl.: Backhaus, K.; Erichson, B.; Plinke, W.; Weiber, R. (1994), S. 33

[2] vgl.: Backhaus, K.; Erichson, B.; Plinke, W.; Weiber, R. (1994), S. 41

[3] Backhaus, K.; Erichson, B.; Plinke, W.; Weiber, R. (1994), S. 42

23. Mai 201523. Mai 2018

Normalverteilung der Variablen in der Grundgesamtheit

Voraussetzung für die Anwendung von t-Test und F-Test im klassischen Regressionsmodell ist eine Normalverteilung der Residuen. Diese Normalverteilungsannahme ist zur Kleinst-Quadrate-Schätzung der Koeffizienten des linearen Regressionsmodells an sich nicht erforderlich. Wenn diese Annahme jedoch erfüllt ist, ist der Kleinst-Quadrate-Schätzer identisch mit dem Größte-Dichte-Schätzer (=Maximum-Likelihood-Schätzer).[1]

Sowohl Backhaus[2] als auch Kockläuner[3] empfehlen zur Überprüfung der Normalverteilungsannahme die Überprüfung anhand von graphischen Hilfsmitteln. Zu diesem Zweck bieten sich vor allem zwei graphische Unterstützungen an. An erster Stelle steht hier das Histogramm der standartisierten Residuenwerte, das über den Regressionsbefehl von SPSS zu erreichen ist. Dabei wird die Verteilung der Residuenwerte einer stilisierten Normalverteilung gegenübergestellt. Auf der anderen Seite stellt SPSS unter dem Regressionsbefehl den Normal Probability (P-P) Plot zur Verfügung. Dieses Diagramm entsteht dadurch, daß die vorliegenden standartisierten Residuenwerte der Größe nach geordnet werden, um auf der vertikalen Achse die zugehörigen Werte ihrer empirischen Verteilungsfunktion abtragen zu können. Auf der horizontalen Achse werden diesen die Funktionswerte der standartisierten Normalverteilung gegenübergestellt. Dies ist die empirische Verteilungsfunktion der Erwartungswerte von n Ordnungsstatistiken. Letztere ergeben sich aus der größenmäßigen Anordnung von n unabhängigen standartisierten normalverteilten Zufallsvariablen. Prozentpunkte deren Verteilung liefern die angesprochenen Erwartungswerte. Normal Probability Plots sind dann wie folgt zu interpretieren: Nach Konstruktion der Achsen sind alle Koordinatenpaare immer dann auf der stilisierten Gerade liegend zu erwarten, wenn die eingehenden Beobachtungen Realisationen unabhängig standardisierter normalverteilter Zufallsvariablen darstellen.[4]

Grundsätzlich ist davon auszugehen, daß die Normalverteilungsannahme in der Regel verletzt sein wird, weil Normalverteilungen in der Realität kaum vorkommen. Der zentrale Grenzwertsatz liefert aber die Argumentation dafür, daß die Störgrößen im Regressionsmodell wenigstens als näherungsweise normalverteilt gelten können.[5] In diesem Zusammenhang ist jedoch die Gefahr der Supernormalität zu beachten. Kurz zusammengefaßt ist darunter zu verstehen, daß bei großen Stichproben die Residuenwerte als gewichtete Summe der Störgrößen auch dann annähernd normalverteilt sein können, wenn die Störgrößen nicht einer Normalverteilung genügen. Daher läßt die Verteilung der Residuen oft nicht die Verletzung der Normalverteilungsannahme erkennen. Hinzu kommt in dieser Untersuchung, daß die Konstrukte aus mehreren Items gebildet werden, was die Nicht-Normalität weiter verschleiert. „Trotzdem bleibt diese Verteilung das einzige Instrument zur Überprüfung der Normalverteilungsannahme, die für alle n Störgrößen ui und damit n einzelne Verteilungen gelten soll.“[6] Auf die weiteren statistischen Bedingungen für die Überprüfung der Normalverteilungsannahme wird an dieser Stelle nicht eingegangen, da diese statistischen Feinheiten nicht Thema einer inhaltlichen Arbeit sein können und den Umfang der Arbeit sprengen würden. Der interessierte Leser sei auf Kockläuner[7] verwiesen. Nur soviel soll hier angemerkt werden: Für die Überprüfung der Normalitätsannahme werden die intern studentisierten Residuen betrachtet, um konstante Varianzen sicherzustellen[8]. Außerdem sollte die Normalitätsbedingung nach Kockläuner die zuletzt zu überprüfende Bedingung sein. Dies hat den Vorteil, daß nicht von n einzelnen Verteilungen, also für jede einzelne Störgröße eine, ausgegangen werden muß, zu denen jeweils nur ein Residuenwert zur Verfügung steht, sondern von einem Verteilungsmodell, zu dessen Überprüfung n Residuenwerte vorliegen.[9]

Die Überprüfung der graphischen Darstellungen führte zu folgenden Ergebnissen: Weitgehend lassen die Normal Probability Plots und vor allem die Histogramme eine relativ gute Anpassung an die Normalverteilung erkennen. Stärkere Abweichungen sind vor allem bei der 3. Regression und männlichem Geschlecht und bei der 5. Regression und weiblichem Geschlecht zu erkennen. Die Graphiken sind nicht in dieser Arbeit abgedruckt, können jedoch mit Hilfe der Syntax auf der beigefügten Diskette problemlos dargestellt werden.

Zur Überprüfung der Residuen auf Normalverteilung, soll zusätzlich der Kolmogorov-Smirnov-Anpassungstest durchgeführt werden. Dieser ist für kleine Stichproben besser geeignet als der -Test, da letzterer nur approximativ arbeitet.[10] Im Falle eines Ablehnens der Normalverteilungsannahme durch diesen, kann im Anschluß noch eine weitere Verteilungsüberprüfung über Schiefe und Exzeß durchgeführt werden.

Die H0 des Kolmogoroff- Smirnov-Anpassungstest lautet, daß die empirisch ermittelte Verteilung gleich der Normalverteilung ist. Die Alternativhypothese lautet, daß sich die beiden Verteilungen für mindestens einen Wert der unabhängigen Variable unterscheiden. Die Hypothese H0 wird nun zum Niveau verworfen, wenn Dn multipliziert mit der Wurzel aus der Anzahl der Beobachtungen, größer oder gleich dem aus der Tabelle[11] zu entnehmenden kritischen Wert ist. „Die Größe Dn gibt den größten vertikalen Abstand zwischen hypothetischer und empirischer Verteilungsfunktion an.“[12] Nun ist das Signifikanzniveau zu bestimmen. Üblicherweise wird ein Signifikanzniveau von 1% oder 5% gewählt. An dieser Stelle ist zu beachten, daß es hier darum geht, die Normalverteilungsannahme zu überprüfen und dabei den -Fehler, das heißt eine fälschliche Beibehaltung der Nullhypothese zu minimieren. Da sich der -Fehler aus 1- -Fehler berechnet, erscheint es sinnvoll, das Signifikanzniveau an dieser Stelle höher anzusetzen. Im Rahmen der dieser Arbeit wird deshalb ein Signifikanzniveau von 10% zur Ablehnung der Normalverteilungsannahme angesetzt.

weiblich

männlich

Regression

K-S-z

Signif.-Niveau

K-S-z

Signif.-Niveau

1.a

1.1021

.1761

0.8518

.4626

1.b

0.4965

.9662

0.6876

.7317

2.a

0.8341

.4898

1.0320

.2373

2.b

1.0907

.1851

0.7863

.5666

1.0867

.1884

1.1211

.1618

0.7999

.5444

0.7258

.6680

1.0018

.2681

0.6126

.8472

0.9536

.3230

0.7569

.6156

Tab. 3 (Kolmogoroff-Smirnov-Test-Wert)

Für sämtliche Regressionen liegen die Kolmogoroff-Smirnov-z-Prüfgrößen und die entsprechenden Signifikanzniveaus über dem geforderten Mindestmaß[13]. Kritisch sind vor allem die Kolmogoroff-Smirnov-z-Prüfgrößen für die Regression 1.a (weiblich), die Regression 5. (weiblich), da hier ja nur 38 Werte in die Untersuchung eingehen und Regression 3. (männlich). Die Normalverteilungsannahme für die Residuenwerte wird trotzdem für alle Regressionen als bestätigt angesehen. Auch das dritte und fünfte Regressionsmodell werden weiter verfolgt, auch wenn vor allem bei dem dritten Modell die Werte auf eine schlechte Erfüllung der Normalverteilungsannahme hindeuten.

[1] vgl.: Gruber, Josef, (1982), S. 58

[2] vgl.: Backhaus, K.; Erichson, B.; Plinke, W.; Weiber, R., (1994), S. 32

[3] vgl: Kockläuner, Gerhard, (1988), S. 58 ff

[4] vgl.: Kockläuner, Gerhard, (1988), S. 58 ff

[5] vgl.: Hartung, J., (1982), S. 122

[6] Kockläuner, Gerhard, (1988), S. 73

[7] Kockläuner, Gerhard, (1988), S. 60-76

[8] vgl.: Kockläuner, Gerhard, (1988), S. 63

[9] Kockläuner, Gerhard, (1988), S. 73

[10] vgl.: Hartung, J., (1982), S. 183

[11] vgl.: Hartung; J. (1982), S. 184

[12] Hartung; J. (1982), S. 184

[13] vgl.: Hartung; J. (1982), S. 184

23. Mai 201523. Mai 2018

Prüfung der Regressionsfunktion als ganzes (F-Test)

Nachdem die Prämissen des linearen Regressionsmodells weitgehend gesichert sind, muß nun der Zusammenhang zwischen Regressoren und Regressand näher untersucht werden.

An erster Stelle wird nun überprüft, ob die Regressoren insgesamt überhaupt einen Einfluß auf den Regressanden haben. Dabei wird die Nullhypothese, die besagt, daß die Regressionsfunktion als ganzes unbrauchbar ist, gegen die Alternativhypothese, daß die Regressoren einen Einfluß auf den Regressanden haben, getestet. Als Signifikanzniveau wird hier .99 festgelegt. Dadurch wird erreicht, daß eine Ablehnung der Nullhypothese mit 99 %-iger Wahrscheinlichkeit nicht zu unrecht erfolgt.

In der folgenden Tabelle sind für beide Geschlechter jeweils in der ersten Spalte, der Anteil der durch die Regressoren erklärte Streuung, bereinigt um die Einflüsse durch die Anzahl der Regressoren wiedergegeben. In den darauf folgenden Spalten sind zuerst der F-Wert und danach das dazu gehörige Signifikanzniveau dargestellt.

weiblich

männlich

Regression

Adjusted R

Square

Signif F

Adjusted R

Square

Signif F

1.a

.11899

5.63696

.0013

.18846

9.05052

.0000

1.b

.41877

19.55244

.0000

.32525

13.53285

.0000

2.a

.29286

15.21892

.0000

.26307

13.37552

.0000

2.b

.29092

11.56449

.0000

.28397

11.31143

.0000

.26416

37.97533

.0000

.06655

8.41488

.0046

.43459

27.67024

.0000

.20778

13.85188

.0005

.13298

6.67470

.0140

.01627

1.81021

.1848

.34825

19.34569

.0000

.34989

19.65775

.0000

Tab. 4 (Bestimmtheitsmaß und F-Test)

Besonders ins Auge fallen die Ergebnisse bezüglich der Regressionen 1.a, 3. und 5.. Da die Ergebnisse der 5. Regression sowohl bezüglich des Bestimmtheitsmaßes, als auch bezüglich des Signifikanzniveaus nicht befriedigend sind, soll diese Regression aus der weiteren Analyse ausgeschlossen werden. Aufgrund der Daten in der Stichprobe muß davon ausgegangen werden, daß die Regressoren in der 5. Regression keinen Einfluß auf den Regressanden haben. Die Ergebnisse der 1. und 3. Regression sollen weiter untersucht werden, um unter Umständen später eine Erklärung, vor allem für die niedrigen Werte des Bestimmtheitsmaßes zu finden. Auffällig ist, daß vor allem die Regressionen, die schlechte Werte bei der Überprüfung der Normalverteilungsannahme zeigten, auch beim F-Test schlechte Werte zeigen. Wie schon vorher angemerkt wurde, führt eine Verletzung der Normalverteilungsannahme nicht dazu, daß die Kleinst-Quadrate-Regression nicht effizient ist, sondern nur dazu, daß F-Test und t-Test weniger aussagekräftig sind. Aus diesem Grunde werden die Ergebnisse bei Regression 1. und Regression 3. toleriert.