Explikation | IQ-MarkenManagement

23. Mai 201523. Mai 2018

Markentreue

Allgemeine Grundlagen

Es gibt in der Literatur eine ganze Reihe verschiedener Definitionen des Begriffs Markentreue.[1] Allen gemeinsam sind zwei Aussagen. Die erste notwendige Eigenschaft dafür, daß man von Markentreue sprechen kann, ist die, daß die Käufe nicht zufällig erfolgen, sondern bestimmte Marken signifikant mehr gekauft werden, als dies durch Zufall zu erklären wäre. Als zweite notwendige Eigenschaft wird gefordert, daß markentreue Konsumenten eine positive Einstellung zu ihrer Marke haben.[2]

Darüber hinaus kann man die verschiedenen Konzepte der Markentreue in drei Kategorien einordnen[3]: behavioristische Markentreue-Konzepte, einstellungsorientierte Markentreue-Konzepte und einstellungsgeprägte Verhaltenskonzepte der Markentreue.

Behavioristische Markentreue-Konzepte sind solche, die sich in erster Linie mit dem gezeigten Verhalten beschäftigen und die zugrundeliegenden Einstellungen gar nicht oder nur am Rande behandeln. Zu diesen Konzepten zählen das Kaufreihenfolge-Konzept, das Marktanteils-Konzept, das Markenanzahl-Konzept, das Kaufzeitpunkt-Konzept und das Wiederkaufwahrscheinlichkeits-Konzept. Insbesondere die stochastischen Markenauswahl-Modelle, die auf dem Konzept der Wiederkaufwahrscheinlichkeit beruhen, haben in der angelsächsischen Literatur große Beachtung und Verbreitung gefunden und werden dort oft als operationale Definitionen gebraucht. Aus diesem Grunde und weil einige der im folgenden gemachten Aussagen auf Untersuchungen beruhen, die sich auf solche Modelle beziehen, sollen die wichtigsten hier kurz dargestellt werden. Es gibt noch eine große Anzahl weiterer Modelle, die aber meist nur Kombinationen der hier aufgeführten sind. Implizit schließt sich das später erarbeitete Modell an die Betrachtungsweise des Linearen Lernmodells und des „new trier“- Modells an. Eine Kritik der verschiedenen Modelle würde den Rahmen dieser Arbeit sprengen. Für eine Kritik der Modelle und Anwendungsbeispiele siehe Massy[4] oder zusammenfassend Wierenga[5] oder Nolte[6].

Das Bernoulli-Modell

Modelle dieser Gruppe haben gemeinsam, daß das mögliche Verhalten dichotomisiert wird. Es gibt nur zwei Verhaltensweisen, entweder „1“ = die interessierende Marke wird gekauft oder „0“ = eine andere Marke wird gekauft. Die Entscheidung zwischen diesen beiden Verhaltensweisen wird als Zufallsvariable betrachtet. Von einer Zufallsvariablen wird gesagt, daß sie eine Bernoulli-Verteilung hat, wenn sie nur zwei Werte annehmen kann, nämlich 1 und 0. Der Auswahlprozeß wird Bernoulli-Prozeß genannt, wenn die Marke 1 mit der Wahrscheinlichkeit p und die Marke 0 mit der Wahrscheinlichkeit (1-p) ausgewählt wird. Die Kaufhistorie hat bei dieser Betrachtung keine Auswirkung auf die anstehende Kaufentscheidung, da die Wiederkaufwahrscheinlichkeit durch p vorgegeben ist. Es existieren homogene und heterogene Bernoullimodelle. Der Unterschied zwischen diesen besteht in der Verteilung der Wiederkaufwahrscheinlichkeit. Während beim homogenen Modell die Wahrscheinlichkeit p für alle Individuen gleich ist, ist beim heterogenen Modell diese Wahrscheinlichkeit p über die Gesamtheit verteilt. Das bedeutet, es gibt Konsumenten mit einer höheren und solche mit einer niedrigeren Wahrscheinlichkeit, der Mittelwert ist jedoch immer p.

Das Markov-Modell

Dieses Modell geht auf den russischen Mathematiker Markov zurück.[7] Charakteristikum dieses Modells ist, daß die Wahrscheinlichkeitsverteilung für die alternativen Marken in zurückliegenden Perioden ermittelt und aus dieser Verteilung die Wahrscheinlichkeit für markentreues Verhalten in der kommenden Periode berechnet wird. Das Modell geht davon aus, daß nur einige wenige zurückliegende Käufe einen Einfluß auf das Kaufverhalten haben. Das meistbenutzte Modell ist das „first order Markov Model“. Für dieses spezielle Markov-Modell ist nur die letzte Kaufhandlung für die aktuelle Kaufentscheidung relevant. Alle vor der letzten Kaufhandlung liegenden Käufe haben demnach keinen Einfluß mehr auf die aktuelle Entscheidungssituation. Es wird wieder unterschieden zwischen einer homogenen und einer heterogenen Variante. Während bei der homogenen Variante jeweils einheitliche Übergangswahrscheinlichkeiten für die gesamte Population ermittelt werden, wird bei der heterogenen Variante von einer Streuung ausgegangen. Das heterogene Modell vereint damit zwei positive Eigenschaften: Erstens wird die Kaufhistorie in Betracht gezogen und zweitens werden nicht alle Individuen gleich behandelt. Da bei diesem Modell, im Gegensatz zum Bernoulli-Modell, nicht nur zwei Zustände relevant sind, sondern schon beim Zwei-Produkt-Markt vier Übergangswahrscheinlichkeiten existieren, sind mindestens zwei Wahrscheinlichkeiten zu dessen Beschreibung notwendig. Bei dem n-Produkt-Markt steigen die notwendigen Wahrscheinlichkeiten entsprechend. Für jede dieser Wahrscheinlichkeiten müßte eigentlich eine eigene Verteilung ermittelt werden. Um die Komplexität zu reduzieren, werden in der Praxis meist Relationen zwischen den verschiedenen Wahrscheinlichkeiten festgesetzt, so daß letztendlich nur noch eine Wahrscheinlichkeit p untersucht werden muß.

Das lineare Lern-Modell

In einem „first-order Markov model“ kann die Wiederkaufwahrscheinlichkeit in Abhängigkeit von dem in der Vorperiode erworbenen Produkt nur zwei Werte annehmen. Beim linearen Lernmodell ist die Situation komplizierter: Die Wahrscheinlichkeit eines Wiederkaufes im Zeitpunkt (t+1) also p(t+1) ergibt sich aus der Formel: pt+1 = e+gpt.

Im Zwei-Produkt-Fall, den wir hier betrachten wollen, weil er der in der Literatur meistbehandelte ist, existieren zwei Formeln, die den Einfluß einer bestimmten Kaufhandlung im Zeitpunkt t auf die Kaufwahrscheinlichkeit im Zeitpunkt t+1 determinieren. Es gibt eine Formel, die die Wahrscheinlichkeit für Produkt 1 in t+1 bestimmt, wenn Produkt 1 in t gewählt wurde, und es gibt eine Formel, die die Wahrscheinlichkeit für Produkt 1 in t+1 bestimmt, wenn Produkt 1 in t nicht gewählt wurde. Die Formeln sind simple Geradengleichungen. Aus diesem Grunde läßt sich das Modell sehr einfach graphisch darstellen. Die Parameter in den Geradengleichungen werden durch Schätzverfahren aus der Kaufhistorie ermittelt.

Das probabilistische Diffusionsmodell

Bei diesem erst in neuerer Zeit entwickelten Modell ist die Wiederkaufwahrscheinlichkeit unabhängig von der Kaufhistorie. Insoweit handelt es sich eigentlich um ein Bernoulli-Modell. Bei dem probabilistischen Diffusionsmodell wird jedoch nicht angenommen, daß die Wiederkaufwahrscheinlichkeit vom Zufall abhängig ist. Stattdessen wird die Wiederkaufwahrscheinlichkeit in Abhängigkeit von externen Effekten gesehen.[8]

Das „new trier“-Modell

Dieses Modell gliedert die Entwicklung der Wiederkaufwahrscheinlichkeit in zwei Phasen. In der ersten Phase wird davon ausgegangen, daß der Konsument wahllos verschiedene Marken ausprobiert. Der Auswahlprozeß gleicht also einem Bernoulliprozeß. Im Anschluß an diese Phase findet eine Bewertung aller Marken statt. Dadurch ändern sich die Wiederkaufwahrscheinlichkeiten abrupt, bleiben dann jedoch für die folgenden Kaufentscheidungen gleich. Es liegt also erneut ein Bernoulliprozeß vor. Darüber hinaus wird jeder Marke nicht nur eine Wiederkaufwahrscheinlichkeit, sondern auch eine Ablehnungswahrscheinlichkeit zugeordnet. Diese Ablehnungswahrscheinlichkeit nimmt mit abnehmender Rate von Kauf zu Kauf zu und nähert sich einem Grenzwert. Dies führt jedoch nicht dazu, daß die Wiederkaufwahrscheinlichkeit abnimmt. Diese bleibt vielmehr während des gesamten Prozesses gleich oder wird im Falle des Eintretens der Ablehnung gleich Null.[9]

„Zusammenfassend kann man sagen, daß sich die skizzierten modell-theoretischen Forschungsstrategien kaum zur Erklärung des Treueverhaltens eignen. Sie zeichnen sich jedoch durch wenige und einfach zu beschaffende Variablen aus, um unter Berücksichtigung absatzpolitischer Aktivitäten die Markentreue bzw. den Markenwechsel in der Zukunft zu prognostizieren.“[10]

„The degree to which loyalty to brand names may be said to exist is partially a function of the method of measurement and individual interpretation.“[11]

Wie die beiden Zitate andeuten, ist Markentreue ein hypothetisches Konstrukt, dessen Definition dem Belieben des Forschers unterliegt. Zwar kann man mit Hilfe dieses Konstruktes ermitteln, ob Markentreue nach der selbstkonstruierten Definition vorliegt und prognostizieren, ob die Indikatoren dieses Konstruktes auch in Zukunft zu beobachten sein werden, die beschriebenen Modelle helfen jedoch nicht bei der Frage, wieso die Indikatoren auftreten. Aus diesem Grunde werden die oben beschriebenen Modelle im Rahmen dieser Arbeit nur am Rande behandelt.

Besser geeignet sind die einstellungsorientierten Modelle.

Einstellungsorientierte Markentreue-Konzepte sind solche, die die Markentreue in Einstellungskategorien definieren und die Verhaltenskomponente nur insoweit beachten, als davon ausgegangen wird, daß Einstellungen zu einer entsprechenden Markenauswahl führen. Zu diesen Konzepten gehören das Markenpräferenz-Konzept, das Wiederkaufabsichts-Konzept und das Substitutionsbereitschafts-Konzept. Bisher existieren relativ wenige ausformulierte einstellungsorientierte Modelle. Der größte Mangel der existierenden Modelle besteht darin, daß keine Aussage über den Zusammenhang zwischen der Einstellung als Indikator und der tatsächlich ausgeführten Kaufhandlung gemacht wird. Fazio trifft im Rahmen seiner Untersuchung eine Aussage, die darauf schließen läßt, daß der Zusammenhang bei markentreuen Einstellungen relativ hoch ist. „Previous research has demonstrated that behaviour is more accurately predicted from attitudes formed via direct, behavioral interaction with the attitude object than from attitudes developed via indirect, nonbehavioral experience.“[12] Da Markentreue immer mit einer Erfahrung mit dem Produkt verbunden ist, trifft diese Aussage auf Markentreue-Einstellung zu.

Einstellungsgeprägte Verhaltenskonzepte der Markentreue sind solche, die beide Komponenten ausführlich behandeln und die funktionale Abhängigkeit zwischen beiden als konstitutiv betrachten. Sie sind dadurch näher an der Realität, haben aber oft den Nachteil, wesentlich komplexer zu sein. Trotzdem gelingt es auch diesen Modellen nicht, den Zusammenhang zwischen Einstellungen und Kaufhandlungen eindeutig zu klären.[13]

In dieser Arbeit liegt der Schwerpunkt auf den Einstellungen. Es werden keine Kaufhandlungen beobachtet, sondern nur Einstellungen, Emotionen und Erregungspotentiale durch Befragung ermittelt. Zwar wird eine Wahrscheinlichkeit für einen Wiederkauf erfragt werden, diese ist jedoch eher im Sinne der konotativen Komponente der Einstellung als im Sinne eines Verhaltens zu interpretieren.

Explikation und Diskussion einer Begriffsabgrenzung

Die wichtigsten Gesichtspunkte des Phänomens Markentreue faßt Jacoby in der folgenden Definition zusammen. Es muß an dieser Stelle darauf hingewiesen werden, daß auch diese Definition keine Aussage darüber macht, warum es zu Markentreue kommt, obwohl Jacoby[14] dies behauptet. Vielmehr liefert diese Definition nur ein Set von sechs notwendigen und zusammen hinreichenden Bedingungen, um zu entscheiden, ob es sich um Markentreue handelt oder nicht. Für den entscheidenden Faktor seiner Definition (bias), führt Jacoby darüber hinaus eine behavioristische Operationalisierung an, die nichts mit dem durch Einstellungen geprägten „bias“ zu tun hat. Damit erfüllt Jacoby zwar nicht die Ansprüche, die er an seine Definition stellt[15], für die Zwecke der vorliegenden Arbeit ist die Definition jedoch ausreichend, (BL=brand-loyalty):

„…BL is (1) the biased (i.e., nonrandom), (2) behavioral response (i.e., purchase), (3) expressed over time, (4) by some decision-making unit, (5) with respect to one or more alternative brands out of a set of such brands, and (6) is a function of psychological (decision-making, evaluative) processes.“[16] [17]

Die Punkte (1) und (6) können zusammenfassend interpretiert werden. Sie drücken aus, daß die Kaufentscheidung keine Zufallsentscheidung ist, sondern aufgrund von Bewertungen zustande kommt. In diese Bewertungen gehen dabei nicht nur die aktuell wahrgenommenen Eigenschaften der Marke ein, sondern zusätzlich auch Einstellungen, die aufgrund vorhergehender Erfahrungen oder früherer Informationsaufnahme gebildet wurden. Dabei setzt diese Definition nicht voraus, daß bei jeder Entscheidung eine umfangreiche Bewertung stattfinden muß. Am Ende dieses Informationsverarbeitungsprozesses steht auf jeden Fall eine Einstellung dem Produkt gegenüber. Der Punkt (1), also die Voreingenommenheit, ist der zentrale Punkt in der Definition von Jacoby, da alle anderen Bedingungen entweder sehr nahe an anderen in der Literatur vertretenen Definitionen bleiben oder sich aus dem Zusammenhang von selbst ergeben.[18]

Aufgrund der semantischen Bedeutung des Wortes „Treue“ (oder auch „loyalty“), wird eine Dauerhaftigkeit und eine Bindung an die Marke gefordert. In diesem Sinne wird der Teil (3) zu interpretieren sein. Schon ein zweiter Kauf einer Marke kann als Markentreue bezeichnet werden, wenn die übrigen Bedingungen erfüllt sind.

Aus (5) geht hervor, daß sich Markentreue nicht auf eine einzige Marke beschränken muß. Es werden grundsätzlich zwei Arten von Markentreue unterschieden: Mono-Loyalität und Dual- oder Multi-Loyalität[19]. Unter Mono-Loyalität wird die Neigung zu regelmäßigem Kauf ein- und derselben Marke verstanden. Unter Dual- oder Multi-Loyalität verstehen wir die Neigung zum regelmäßigen Kauf zweier oder einiger weniger Marken. Für diese Untersuchung wollen wir nur im Falle der Mono-Loyalität von Markentreue sprechen. Abwechslungsappetenz als einer der wichtigen Faktoren des Markenwechsels kann nämlich durchaus auch durch den Wechsel zwischen einzelnen Marken innerhalb eines Multi-Loyalitäts-Sets befriedigt werden. Wenn die Multi-Loyalität zugelassen würde, gingen Markentreue und Abwechslungsverhalten ineinander über. Dies mag in manchen Produktkategorien der Fall sein und widerspricht nicht dem später vorgeschlagenen Konzept. Die empirische Überprüfung des Konzeptes bei Berücksichtigung dieses Falles würde dadurch jedoch erheblich erschwert.

Trotzdem verlangt Bedingung (5), daß in der Kaufentscheidungssituation Alternativen vorliegen müssen. Das „evoked set“ muß mehr als eine Marke enthalten. „The brands that become alternatives to the buyer´s choice decision are generally a small number, collectively called his ‚evoked set‘. The size of the evoked set is at best a fraction of the brands that he is aware of and a still smaller fraction of the total number of brands that are actually available in the market.“[20] „Only evoked brands have a highly positive intention.“[21] (to be bought)[22].

Wenn in der Entscheidungssituation keine akzeptablen Alternativen vorliegen, sprechen wir nicht von Markentreue, da die Entscheidung dann nur eine Entscheidung zwischen Kauf oder Nicht-Kauf ist.

Durch (4) wird eindeutig darauf hingewiesen, daß weder der Person, die die Marke kauft, noch der Person, die die Marke verwendet, die Markentreue zuzurechnen ist, sondern nur der Person, die die Markenentscheidung trifft. Dabei wird in der Definition bewußt nicht von Person, sondern von Entscheidungseinheit gesprochen, da die Entscheidung auch von der gesamten Haushaltsgemeinschaft oder von einer Teilgruppe des Haushalts gemeinsam getroffen werden kann.

Erkennbar wird die Markentreue erst durch die Kaufhandlung an sich. Dies ist mit Punkt (2) gemeint. Im Rahmen dieser Untersuchung beschränken wir uns, wie schon oben angedeutet, auf die Aufstellung eines einstellungsorientierten Markentreue-Konzeptes. Deshalb lassen wir diesen Punkt außen vor und sprechen auch ohne die effektiv beobachtete Kaufhandlung von Markentreue, wenn die übrigen Bedingungen erfüllt sind. Die Begriffe Markentreue und markentreue Einstellung werden in dieser Arbeit weitgehend synonym gebraucht, da hier Einstellungen untersucht werden.

Abschließend sei angemerkt, daß es noch eine große Anzahl von ähnlich oder synonym gebrauchten Begriffen gibt, wie Kundentreue, Produktreue, Modelltreue, Firmentreue, Betriebstreue, Qualitätstreue oder verschiedene Differenzierungen von Markentreue. Da eine negative Abgrenzung all dieser Begriffe an dieser Stelle zu umfangreich würde, beschränken wir uns darauf, den Begriff hier in positiver Richtung zu definieren, wie dies oben geschehen ist. Für die negative Abgrenzung wird auf Nolte verwiesen, dessen gesamte Untersuchung ebenfalls auf der Markentreue-Definition von Jacoby beruht.[23]

[1] Jacoby stellt insgesamt 53 Definitionen von Markentreue, die bis 1976 in der Literatur aufgetaucht sind zusammen und diskutiert diese. (vgl.: Jacoby, J.; Chestnut, R. W., (1978), S. 35-41).

[2] vgl.: Nolte, H., (1976), S. 10-11

[3] vgl.: Nolte, H., (1976), S. 15ff und Bass, F. M.; Givon, M. M.; Kalwani, M. U.; Reibstein, D.; Wright, G. P., (1984)

[4] vgl.: Massy, W. F.; Montgomery, D. B.; Morrison, D. G., (1970)

[5] vgl.: Wierenga, B., (1974)

[6] vgl.: Nolte, H., (1976)

[7] vgl.: Fisz, M., (1965)

[8] vgl.: Montgomery, D.B.; Morrison, D.G., (1969)

[9] vgl.: Aaker, D. A., (1970), (1971), (1972)

[10] Weinberg, P., (1990), S. 164

[11] Guest, L. P., (1944), S. 27

[12] Fazio, R.H.; Zanna, M. P., (1978), S. 228

[13] vgl.: Nolte, H., (1976), S. 82 ff

[14] vgl.: Jacoby, J.; Kyner, D.B., (1973), S. 2

[15] vgl.: Tarpey, L.X., (1974)

[16] Jacoby, J.; Kyner, D.B., (1973), S. 2

[17] Eine ähnliche Definition benutzen auch Brown (Brown, G. H., (1952/1953)), Nolte (Nolte, H., (1976)) und Day (Day, G. S., (1969)) in ihren Untersuchungen.

[18] vgl.: Tarpey, L.X., (1974), S. 215

[19] vgl.: Gierl, H. et al., (1993), S. 104

[20] Howard, J.A.; Sheth, J. N., (1969), S. 26

[21] Laroche, M.; Sadokierski, R., (1994), S. 3

[22] Anmerkung des Autors

[23] vgl.: Nolte, H., (1976), S. 104-183

23. Mai 201523. Mai 2018

Explikation des Konzeptes

Aus der Darstellung der gängigen Ansätze im Bereich der Markentreue und der wichtigsten Konzepte des Such- und Entdeckungsverhaltens wurde deutlich, daß keiner der Ansätze alleine in der Lage ist, die Entwicklung markentreuer Einstellungen gemäß der ursprünglichen Hypothese umfassend darzustellen und vor allem zu erklären. Das folgende Konzept wird alle Aspekte der ursprünglichen Hypothese erfassen. Das Konzept wird im Anschluß durch eine empirische Untersuchung getestet.

Wie schon aus der ursprünglichen Hypothese hervorgeht, und im Laufe der Arbeit immer wieder anklang, handelt es sich bei den Gründen, die zur Markentreue führen, vermutlich um zwei getrennte Motivationen. Wenn dies so ist, dann hängt die Entscheidung ganz wesentlich von der Stärke der Motivationen ab. Wie oben definiert, besteht ein direkter Zusammenhang zwischen der Stärke der Motivation und der Stärke der damit einhergehenden Erregung. Unter diesen Voraussetzungen kann eine Beschäftigung mit der Erregung weitere Aufschlüsse über die Lösung dieses Konfliktes bringen. Wenn wir die verschiedenen Ansätze der Theorien des SEV vergleichen, stellen wir fest, daß das Konzept von Berlyne[1] einige interessante Bestandteile enthält, die im Sinne der Grundhypothese sinnvoll erscheinen. Zwei Bestandteile aus dem Konzept von Berlyne werden deshalb übernommen. Erstens betrachten wir im weiteren das von Berlyne vorgeschlagene Erregungspotential als den Auslöser und Maßstab der Erregung. Dies erscheint deshalb sinnvoll, weil dieser Begriff mehr als alle anderen, die in den Konzepten als unabhängige Variable benutzt wurden, Interpretationsspielräume offen läßt. Zweitens soll der Unterscheidung Berlynes, von intrinsischem und extrinsischem SEV gefolgt werden. Diese Unterscheidung zog sich schon durch die gesamte bisherige Arbeit und ist notwendig, um von der Erfüllung der funktionellen Zielvorstellungen zu abstrahieren, durch die die extrinsischen Motivationen zu erklären sind. Ein Punkt, in dem nicht dem Konzept von Berlyne gefolgt wird, ist die Verbindung von Erregung und Affekt. Nach Berlyne gibt es keinen Erregungszustand, der die Ursache für positiven Affekt ist. Diese Annahme ist jedoch, wie oben schon diskutiert wurde, nicht sinnvoll. Außerdem ist der Ansatz von Berlyne nicht in der Lage zu unterscheiden, ob ein Erregungspotential, das oberhalb des optimalen Punktes liegt zu einer Beschäftigung mit der Marke oder zur Abkehr von dieser führt. Um diesen beiden Unzulänglichkeiten aus dem Wege zu gehen, wird für die Erklärung des Zusammenhanges zwischen Stimulation und Affekt statt dessen der Ansatz von Streufert und Driver[2] angewendet. Dieser Ansatz erlaubt sowohl positive als auch negative Affekte. Positive und negative Affekte sind laut Definition nichts anderes als positive und negative Emotionen, aus denen sich dann wiederum die Motivationen nach Abwendung und Zuwendung ableiten. Damit liegen in diesem Bereich die Voraussetzungen vor, die für die Erklärung der Wahrscheinlichkeit von Markentreue und Markenwechsel benötigt werden. Unser Konzept wird also im Bereich des SEV Bestandteile aus dem Konzept von Berlyne und dem Konzept von Driver und Streufert übernehmen. Damit wird dem Vorschlag von Raju und Venkatesan gefolgt, die eine Kombination der Ansätze von Berlyne sowie Streufert und Driver als geeignet für die Konsumentenforschung ansehen.[3]

In Abweichung zu Berlyne, soll das Erregungspotential in zwei Komponenten zerlegt werden. Damit wird die unabhängige Variable gegenüber dem Konzept von Berlyne nicht geändert, sondern nur die vielen Faktoren, die nach Berlyne Bestandteil des Erregungspotentials sein können, in zwei Gruppen geordnet. Der eine Faktor enthält alle positiven und erstrebenswerten Bestandteile des Erregungspotentials, wie Neuartigkeit, Ungewöhnlichkeit, Spannung etc. Dieser Teil soll Abwechslungspotential heißen. Der positive Affekt, der mit diesen Bestandteilen des Abwechslungspotentials verbunden ist, ist durch das Abwechslungsmotiv zu erklären, dessen Befriedigung als angenehm empfunden wird. Die Stärke der mit dem Abwechslungspotential verbundenen Erregung und damit die Stärke des positiven Affektes hängt von der Neuartigkeit des Stimulus und dem persönlichen Reizbedürfnis, also dem Abwechslungsmotiv ab. Je größer das persönliche Reizbedürfnis ist, desto weniger positiv ist tendenziell der mit einem bestimmten Abwechslungspotential verbundene Affekt.

Der andere Faktor enthält alle negativen Bestandteile des Erregungspotentials, also vor allem solche Faktoren, die zu einer Risikowahrnehmung wie Unsicherheit und Mehrdeutigkeit führen. Dieser Teil soll Risikopotential heißen. Der mit den Bestandteilen des Risikopotentials verbundene Affekt läßt sich auf das Motiv nach Risikoreduktion zurückführen, wobei dieses Motiv sich wiederum vermutlich auf dem Konsistenzmotiv gründet. Die Stärke der Erregung ergibt sich zum einen daraus, inwieweit die Bestandteile des Risikopotentials die Unsicherheit über die Folgen einer Entscheidung fördern und zum anderen wie groß die zu erwartenden Konsequenzen sind. Die affektive Bewertung kommt dadurch zustande, daß das Motiv auf die Beseitigung dieses Risikopotentials gerichtet ist und damit ein bestehendes Potential als negativ bewertet wird. Je stärker das Motiv ausgeprägt ist, sprich je geringer der Risikotoleranzlevel ist, desto negativer ist tendenziell der mit einem bestimmten Risikopotential verbundene Affekt. Damit wird ein sehr analytisches Vorgehen eingeschlagen. Das führt dazu, daß zum Beispiel Begriffe wie Komplexität nicht eindeutig einem der beiden Potentiale zugeordnet werden können, sondern in positiv und in negativ bewertete Bestandteile zerlegt werden müssen. Je nach Situation wird Komplexität eher mit positivem oder eher mit negativem Affekt verbunden.

Die Zerlegung des Erregungspotentials in zwei Faktoren hat den Vorteil, daß unterschiedliche Stimuli auch unterschiedlich betrachtet werden können. Dies ist mit keinem der bisherigen Ansätze im Bereich des SEV möglich. So kann es sein, daß zwei Stimuli das gleiche Erregungspotential haben. Während der eine Stimulus jedoch ein großes Abwechslungspotential und ein geringes Risikopotential hat, ist dies bei dem anderen Stimulus genau anders herum. Mit den oben dargestellten Theorien würden beide Stimuli gleich behandelt werden, weil der Affekt alleine aufgrund der Summe der Erregung theoretisch ermittelt würde. Beide bekämen theoretisch das gleiche Erregungsniveau und damit den gleiche Affekt zugeordnet. Gleichzeitig wären in der Realität aber unterschiedliche affektive Bewertungen der Stimuli zu beobachten. Diese Beobachtung könnte mit keiner der etablierten Theorien erklärt werden. Mit diesem neuen Ansatz ist eine differenziertere Betrachtung der Zusammenhänge möglich.

Die Zerlegung des Erregungspotentials hat noch einen weiteren theoretischen Vorteil. So ermöglicht die Trennung der Erregungsgrundlagen in diese beiden Komponenten eine Erklärung des Verhaltens ohne Rückgriff auf die Aktivationstheorien und deren Versuch der Erklärung der affektiven Bewertung, alleine durch etablierte Motive, nämlich dem Konsistenzmotiv oder dem Motiv nach Risikoreduktion und dem Abwechslungsmotiv. Durch einen Stimulus werden diese beiden Motive immer in bestimmtem Umfang befriedigt oder nicht.

Die Entscheidung für oder gegen einen Stimulus stellt sich unter diesen Voraussetzungen als ein klassischer Fall eines Appetenz-Aversions-Konfliktes dar. Durch die Marke sind die positiv und die negativ bewerteten Eigenschaften unverbrüchlich miteinander verbunden. Aufgrund der Motive wird von einer Aversion gegenüber dem Risikopotential und einer Appetenz gegenüber dem Abwechslungspotential ausgegangen.

Raju schlägt vor, die Gesamt-Präferenz für einen Stimulus aus der Summe der einzelnen Präferenzen oder Affekte abzuleiten.[4] Eine Unterstützung dieses Standpunktes kann aus dem bei Herkner dargestellten Einstellungskonzept von Rosenberg abgeleitet werden. „Die Gesamtbewertung von Einstellungsobjekten ist eine Art Mittelwert aller mit dem Einstellungsobjekt verbundenen Meinungen.“[5] Meinung ist jede konkrete Relation zwischen zwei Einstellungsobjekten. Dieser Gesamt-Präferenzwert ist ein Verstärker in bezug auf die Handlung „Kauf der Marke“. Damit kann der Markenkauf oder auch Markenwiederkauf lerntheoretisch interpretiert werden.

Wir gehen davon aus, daß die Eigenschaften, die die beiden Erregungspotentiale bedingen, weitgehend unabhängig voneinander sind. Unter dieser Voraussetzung kann man sowohl für das Abwechslungspotential, als auch für das Risikopotential theoretisch eine Präferenzfunktion bilden. Eine solche Präferenzfunktion soll aussagen, welche Ausprägung dieser Faktoren mit welchem Affekt verbunden ist. An dieser theoretischen Präferenzfunktion alleine kann das tatsächliche Handeln nicht abgelesen werden, da sich die Motivation für bestimmte Handlungen aus der Summation aller mit dem Stimulus verbundenen Affekte ergibt.

Es wird davon ausgegangen, daß zwischen dem Abwechslungspotential und dem positiven Affekt grundsätzlich ein positiv orientierter Zusammenhang besteht. Auch zwischen dem Risikopotential und dem negativen Affekt besteht ein positiver Zusammenhang. Das bedeutet, je größer das Risikopotential ist, desto größer ist der negative Affekt. Grundsätzlich ist der mit dem Risikopotential verbundene Affekt immer negativ. Im Gegensatz dazu ist das Abwechslungspotential nicht grundsätzlich mit positiven Affekten verbunden. Wenn das Abwechslungspotential eines Stimulus so gering ist, daß Langeweile auftritt, sind mit dem Stimulus sogar negative Affekte verbunden. Es wäre möglich, eine weitere analytische Trennung zwischen dem positiven und dem negativen Affekt, der mit dem Abwechslungspotential verbunden ist, vorzunehmen. Darauf soll aus Gründen der Vereinfachung verzichtet werden. Damit sind die Orientierungen der Präferenzfunktionen festgelegt. Es wird sich bei den Präferenzfunktionen vermutlich nicht um Geraden handeln. Zu Beginn dieser Arbeit wurde die Studie von Bawa[6] erwähnt, der einen Zusammenhang zwischen der Vertrautheit mit einer Marke und dem damit verbundenen Nutzen in Form eines umgedrehten Us feststellte. Da Vertrautheit mit einer Marke nichts anderes ist als die Abnahme der durch die Marke hervorgerufenen Erregung, geht es bei Bawa auch um den Zusammenhang zwischen Erregung und Affekt.[7] Wenn wir von der Validität dieser Untersuchung ausgehen, wie müßten die Zusammenhänge zwischen dem Risikopotential bzw. dem Abwechslungspotential und dem entsprechenden Affekt algebraisch gestaltet sein, damit die Summe der beiden eine entsprechende Kurve ergibt? Die Voraussetzungen können zum einen aus dem Aufsatz von Coombs und Avrunin[8] und auf der anderen Seite aus den oben angestellten Überlegungen über die Entwicklung der Affekte aufgrund von Motivbefriedigung im Zeitablauf abgeleitet werden. Damit aus der Summation der beiden Präferenzfunktionen eine Funktion in Form eines umgedrehten Us entsteht, muß die erste partielle Ableitung der Appetenzfunktion nach dem Abwechslungspotential positiv und die zweite partielle Ableitung negativ sein. Eine Funktion, die diese Bedingungen erfüllt ist zum Beispiel die log-Funktion. Dagegen müssen sowohl die erste, als auch die zweite Ableitung der Aversionsfunktion negativ sein. Diese Bedingung wird zum Beispiel von der Funktion f(x)=-x2 erfüllt. Für die näheren mathematischen Spezifikationen und Bedingungen der Eingipfligkeit sei der interessierte Leser auf den Aufsatz von Coombs und Avrunin: „Single-Peaked Functions and the Theory of Preference.“[9] verwiesen. Eine weitere Ausführung in dieser Arbeit würde zum einen den Rahmen sprengen und zum anderen ist nicht zu erwarten, daß übertriebene mathematische Spezifikationen in der empirischen Untersuchung nachgewiesen werden können.

Zusätzlich zu diesen Bedingungen wollen wir davon ausgehen, daß die Appetenzfunktion gegen einen Grenzwert konvergiert oder eine log-Funktion ist und die erste Ableitung der Aversionsfunktion mindestens zweiten Grades oder eine Exponentialfunktion sein muß.

Diese Annahmen über die reale Entwicklung der Erregungspotentiale, ergeben sich aus den theoretischen Vorarbeiten. So ist nachzuvollziehen, daß nicht jeder zusätzliche Neuartigkeitsaspekt eines Stimulus als gleich positiv empfunden wird. Irgendwann tragen zusätzliche neue Aspekte nicht mehr dazu bei, den Stimulus als noch positiver erscheinen zu lassen oder die Veränderung geht nur sehr langsam vonstatten, weil das Motiv immer mehr befriedigt ist. Es gibt einen Sättigungswert bezüglich des Abwechslungspotentials. Vermutlich wird ab einem bestimmten Niveau ein zusätzliches Abwechslungspotential sogar als negativ und das kumulierte Abwechslungspotential deshalb als weniger angenehm empfunden. In dieser Frage soll dem schon erwähnten Zitat von Kroeber-Riel[10] gefolgt werden, daß der Scheitelpunkt in der Konsumentenforschung mit üblichen Mitteln nie erreicht wird. Da der Bereich nach dem Scheitelpunkt nicht mehr interessant ist, reicht die oben getroffene mathematische Spezifikation aus.

Auch bezüglich der Risikoaversion sind die mathematischen Vorgaben durchaus plausibel und ergeben sich aus den theoretischen Vorarbeiten. So wird ein geringes Maß an Risikopotential nicht sonderlich starke negative Affekte hervorrufen. Je größer dieses Risikopotential jedoch wird, desto stärker wird der damit verbundene Konflikt. Die mathematischen Forderungen an die Aversionskurve, führen dazu, daß diese einen Knick hat. Ab diesem Knick führt eine Zunahme des Risikopotentials zu einer überproportionalen Zunahme der negativen Affekte. Damit kann der oben getroffenen Dreiteilung des Risikopotentials gefolgt werden.

Wenn die Präferenzen den obigen Bedingungen folgen, entsteht die in der Literatur geforderte ∩-Kurve. Aus der Abbildung 5 wird deutlich, daß aus diesem Konzept nicht die ∩-Kurve von Berlyne[11], sondern die von Streufert und Driver[12] resultiert, da positive Affekte möglich sind.

Es können zwei Störeinflüsse auftreten, die dazu führen, daß die ∩ – Kurve nicht zustande kommt. Zum einen führt ein unterschiedlich starkes Abwechslungsbedürfnis und eine unterschiedlich starke Risikotoleranz zu einer vertikalen Verschiebung der zwei Kurven. Zum anderen können produktspezifische Risiko- oder Abwechslungseigenschaften der Marke zu einer horizontalen Verschiebung der Kurve führen.

An dieser Stelle wollen wir auf Berlynes[13] Unterscheidung in intrinsische und extrinsische Motive zurückkommen. Die bisher behandelten Erregungspotentiale fallen nach dieser Kategorisierung unter die intrinsischen Motive. Neben Abwechslungssuche und Risikovermeidung gibt es jedoch noch andere Faktoren, die die Wiederkaufwahrscheinlichkeit einer Marke bedingen. Gemeint ist der Bereich, in dem bestimmte Produkte die Lösung für Probleme des Konsumenten sind. Dieser Bereich der Antriebe fällt in die Kategorie der extrinsischen Motive. Der Affekt gegenüber der Marke, der sich aus einem solchen Motiv ergibt, kann von entscheidender Bedeutung sein. Ein besonders starkes extrinsisches Motiv kann einen Konsumenten dazu veranlassen, eine Marke weiterhin zu kaufen, obwohl sie langweilig oder zu riskant ist. Solche Motive sind meist relativ stabil über die Zeit, weil es sich um Einstellungen gegenüber der Marke handelt. An dieser Stabilität ändert eine lediglich veränderte Vertrautheit nichts. Es sei denn, durch diese Vertrautheit werden neue Informationen bekannt, die die Einstellung des Konsumenten gegenüber der Marke ändern. Die extrinsischen Aspekte werden bei diesem Konzept vollkommen ausgeklammert. Untersucht wird nur der dahinter verborgene Prozeß, der auf den intrinsischen Motivationen beruht. Bei der Untersuchung ist deshalb darauf zu achten, daß keine Produkte ausgewählt werden, bei denen extrinsische Motivationen im Vordergrund stehen.

Wenn die extrinsischen Motivationen außer Betracht gelassen werden, sind die oben dargestellten Zusammenhänge in der Lage, die Grundhypothese zu erklären. Zunächst sind bei einer neuen Marke sowohl das Abwechslungspotential, als auch das Risikopotential tendenziell hoch. Wenn die Marke immer wieder gekauft wird, werden beide im Laufe der Zeit langsam abnehmen. Da die wichtigsten Risikofaktoren annahmegemäß sehr schnell abgebaut werden, wird das Risikopotential schnell abnehmen. Die Reduktion des Abwechslungspotentials geht gemäß der Annahmen nicht so schnell vonstatten. Damit wird die affektive Bewertung und damit die Wahrscheinlichkeit der Markentreue zunächst steigen. Nach und nach wird das Risikopotential bei wiederholter Konsumtion immer geringer werden. Das Gefälle ist allerdings gering. Demgegenüber nimmt die Abnahme des Abwechslungspotentials immer mehr zu. Damit beginnt die affektive Bewertung der Marke schlechter zu werden, wodurch die Wiederkaufwahrscheinlichkeit sinkt. Irgendwann wird der Gesamtaffekt negativ werden, was zu einer Wiederkaufwahrscheinlichkeit von etwa null aufgrund von Langeweile führt, sofern nicht extrinsische Gründe dagegen sprechen. Bei all diesen Aussagen ist das Gesetz des relativen Effektes zu beachten. Aus diesem Grunde ist die Wiederkaufwahrscheinlichkeit nicht alleine von der betrachteten Marke, sondern auch von allen anderen Marken abhängig. Außerdem hat die Veränderung der Wiederkaufwahrscheinlichkeit der aktuellen Marke Einfluß auf die Kaufwahrscheinlichkeit der anderen Marken.

[1] vgl.: Berlyne, D. E., (1960, 1963, 1970)

[2] vgl.: Streufert, S.; Driver, M. J., (1971)

[3] vgl.: Raju, P. S.; Venkatesan, M., (1980), S. 5

[4] vgl.: Raju, P. S., (1981)

[5] vgl.: Herkner, W., (1993), S. 182

[6] vgl.: Bawa, K., (1990)

[7] Nutzen ist bei Bawa im Sinne von Affekt gemeint.

[8] vgl.: Coombs, C. H.; Avrunin, G. S., (1977)

[9] vgl.: Coombs, C. H.; Avrunin, G. S., (1977)

[10] vgl.: Kroeber-Riel (1992), S. 77

[11] vgl.: Berlyne, D. E., (1960)

[12] vgl.: Streufert, S.; Driver, M. J., (1971)

[13] vgl.: Berlyne, D. E., (1960)

23. Mai 201523. Mai 2018

Gütekriterien der Messung

Die Befragung durch Fragebogen ist eine Messung. Auf die praktische Bedeutung von Messungen bezogen, müssen diese vor allem objektiv, vergleichbar, ökonomisch und nützlich sein.[1] Diese Gütekriterien sind nur schwierig zu überprüfen. Aus statistischer Perspektive sind zwei weitere Gütekriterien wichtiger, die durch statistische Prüfungen zu belegen sind: Validität und Reliabilität. Reliabilität ist gemäß der klassischen Testtheorie definiert, als der Quotient der Varianz der wahren Werte und der Varianz der beobachteten Werte.[2] Die Reliabilität ist ein Maß dafür, inwieweit die gemessenen Werte mit den tatsächlichen Werten übereinstimmen. Demgegenüber ist die Validität ein Maß dafür, inwieweit das Meßinstrument wirklich das mißt, was es messen soll.

Um die Konstruktvalidität der Variablen zu überprüfen, wurde nach angemessenen Recodierungen, eine „näherungsweise“ konfirmatorische Faktorenanalyse durchgeführt, indem alle Indikatoren, die Bestandteil eines Konstruktes werden sollen, in eine gemeinsame Faktorenanalyse eingegeben wurden.[3]

Die Konstrukte Reizbedürfnis, Abwechslungsaffekt, Risikotoleranz und ursprüngliches Abwechslungspotential konnten aufgrund dieser Faktorenanalyse als relativ valide bewertet werden. Durch eine weitere Faktorenanalyse mit den übrigen Indikatoren konnten trotz teilweise erheblicher Fehlladungen, die vermutlich auf mangelhafte Operationalisierung zurückzuführen sind, die Konstrukte Involvement und ursprüngliches Risikopotential bestätigt werden. Problematisch verhalten sich die Ladungen bei dem Konstrukt Konsequenzen und hier vor allem die von RIAFFSOZ und RIAFFPHY. Da dieses Konstrukt noch aus einer ganzen Reihe weiterer Items besteht, soll für diese Arbeit trotzdem an dem Konstrukt Risikoaffekt festgehalten werden. GESAFF_X zeigt hohe Ladungen auf mehreren verschiedenen Faktoren. Bei der Zuordnung der Items aufgrund der jeweils höchsten Ladung, teilen sich die Items auf zwei Faktoren auf. Die Operationalisierung des Gesamtaffektes ist damit als unsicher zu bezeichnen.

Eine weitere Unstimmigkeit tauchte bei den Konstrukten Gewöhnung und Unsicherheit auf. Beide Konstrukte zeigten sehr hohe Ladungen auf dem gleichen Faktor. Dieser Sachverhalt kann theoretisch interpretiert werden, da eine sehr hohe Abhängigkeit zwischen Unsicherheit und Gewöhnung besteht. Je größer die Gewöhnung ist, desto geringer wird tendenziell die empfundene Unsicherheit sein. Umgekehrt wird mit großer wahrgenommener Unsicherheit das Gefühl von Gewöhnung eher gering sein. Beide Konstrukte werden weitgehend ohne affektive Bewertung ermittelt. Trotz dieser Überschneidung werden Unsicherheit und Gewöhnung im weiteren als zwei getrennte Konstrukte behandelt.

Die „rotated factor matrix“ ist im Anhang abgedruckt. Dort können die hier abgeleiteten Ergebnisse nachvollzogen werden.

Als Reliabilitätsmaß der Messung wird der Koeffizient „Cronbachs Alpha“, der ein Maß für die interne Konsistenz einer Skala darstellt, ermittelt. Die Reliabilitätskoeffizienten können der folgenden Tabelle entnommen werden. Weitere Informationen sind im Anhang abgedruckt. Jede Skala setzt sich zunächst aus den Items zusammen, die oben zu den entsprechenden Konstrukten genannt wurden. Um die Reliabilität zu erhöhen, wurden, nach inhaltlicher Überprüfung, teilweise Items aus der Skala ausgeschlossen und der Reliabilitätskoeffizient danach erneut berechnet.

Skala (Konstrukt)	alpha
Abwechslungsaffekt (ABWAFF_X)	.8567
ursprüngliches Abwechslungspotential (ABWPOURX)	.8249
Gesamtaffekt (GESAFF_X)	.6667
Gewöhnung (GEWOEH_X)	.7296
Gewöhnung (GEWOEH_X ohne GEWOEH_3)	.7621
Involvement (INVOLV_X)	.6593
Involvement (INVOLV_X ohne INVOLV_1)	.7077
ursprüngliches Risikopotential (KONURS_X)	.6777
Reizbedürfnis (REIZBEX1)	.9549
Konsequenzen (KONSEQ_X)	.7481
Risikotoleranz (RISLUSX1)	.7906
Unsicherheit (UNSICH_X)	.0981
Unsicherheit (UNSICH_X ohne UNSICH_4 und UNSICH_5)	.7777
Wiederkaufwahrscheinlichkeit (WKW_X)	.6316

Tab. 1 (Cronbachs Alpha)

Ab welcher Höhe des Testwertes „Cronbachs Alpha“, das getestete Meßinstrument als reliabel zu bezeichnen ist, ist nicht eindeutig festgelegt. Üblicherweise werden Koeffizienten von .7 bis .8 als ausreichend angesehen. In der Praxis werden häufig weit geringere Koeffizienten noch akzeptiert.[4] Nach dieser Maßgabe können alle Skalen bis auf WKW_X, GESAFF_X und KONURS_X auf jeden Fall als reliabel eingestuft werden. Bei der Interpretation ist jedoch zu berücksichtigen, daß die Höhe von Cronbachs Alpha mit steigender Itemzahl einer Skala ansteigt. Bedenkt man dies,deuten die relativ niedrigen Koeffizienten der Skalen WKW_X, GESAFF_X und KONURS_X die aus nur 4, bzw. 6 Items bei KONURS_X gebildet wurden, doch auf eine ausreichende innere Konsistenz hin. Alle drei Konstrukte verbleiben deshalb in der Auswertung.

[1] vgl.: Schnell, R.;Hill, P.B.; Esser, E. (1993), S. 158

[2] vgl.: Schnell, R.;Hill, P.B.; Esser, E. (1993), S. 158

[3] vgl.: Schnell, R.;Hill, P.B.; Esser, E. (1993), S. 174 und Bortz, J., (1993), S. 518

[4] vgl.: Schnell, R.;Hill, P.B.; Esser, E. (1993), S. 161

23. Mai 201523. Mai 2018

Aufbereitung der Daten

Im Anschluß an die Variablendefinition, die Recodierung aufgrund falscher Orientierung der Items im Fragebogen und die Validitäts- und Reliabilitätsuntersuchungen, wurden folgende mathematische Definitionen für die einzelnen Konstrukte als statistisch sinnvoll erachtet und entsprechende Transformationen durchgeführt. Im Anschluß daran sind noch einige Recodierungen vorgenommen worden, die später die Auswertung der Ergebnisse vereinfachen sollen.

Gewöhnung:

gewoeh_x = (gewoe_1+gewoe_2+gewoe_4)/3

Risikoaffekt:

unsich_x = (unsich_1+unsich_3+unsich_2)/3

konseq_X = (((riaffzei+riafffin+RIAFF__1+RIAFF__2+RIAFFQU1+

RIAFFQU2+riaffphy+riaffpsy +riaffsoz)/9)*riaffgew)/7

risiko_x = konseq_x*unsich_x/7

Abwechslungsaffekt:

abwaff_x = (abwaff_1+abwaff_2+abwaff_3+abwaff_4+abwaff_5+

abwaff_6+abwaff_7+abwaff_8+abwaff_9)/9

ursprüngliches Abwechslungspotential:

abwpourx = (abwpour1+abwpour2+abwpour3+abwpour4)/4

ursprüngliches Risikopotential:

konurs_x = (konfinur+konphyur+konpsyur+konquaur

+konsozur+konzeiur)/6

Involvement:

INVOLV_X = (involv_4+involv_2+involv_3)/3 .

Gesamteffekt:

gesaff_x = (gesaff_1+gesaff_2+gesaff_3+gesaff_4)/4

Die Variablen für die Risikotoleranz und das Reizbedürfnis kommen durch jeweils eine Faktoranalyse zustande und werden folgendermaßen benannt:

Risikotoleranz: RISLUSX1

Reizbedürfnis: REIZBEX1

Wiederkaufwahrscheinlichkeit:

wkw_x = (wkw1+wkw4+wkw2+wkw3)/4

Drehen der Kurve der Abwechslungsaffekte:

abwaff2x = 8-abwaff_x

Drehen der Kurve der Risikoaffekte:

risiko2x = risiko_x-7

Skalentransformation (Logarithmieren der Gewöhnung):

gewtr_1 = LG10(gewoeh_x)

Skalentransformation (Quadrieren der Gewöhnung):

gewtr_2 = gewoeh_x ** 2

Addieren von Abwechslungs- und Risikoaffekt:

sumaff_x = abwaff2x+risiko2x

Gesamtaffekt minus Risikoaffekt:

abafkonx = gesaff_x-risiko2x

23. Mai 201523. Mai 2018

Vorwort Überprüfung der Untersuchungshypothesen

Bei den aufgestellten Hypothesen handelt es sich um Zusammenhangshypothesen. Diese werden sämtlich im folgenden mit Hilfe von Regressionsmodellen überprüft. In einigen Fällen handelt es sich um nichtlineare Zusammenhänge. Auf Anraten eines Spezialisten[1] wurden die Daten so transformiert, daß eine lineare Regression vorgenommen werden konnte. Auch nach dieser Transformation sind die durchzuführenden Tests noch aussagekräftig oder können zumindest als Approximation angesehen werden. Auf jeden Fall ist die Anwendung des linearen Regressionsmodells für die Zwecke einer inhaltlichen Arbeit ausreichend. Nichtlineare Regression ist für dieses Anwendungsgebiet übertrieben aufwendig, vielmehr eher für ökonometrische Zwecke geeignet und außerdem mit SPSS nicht befriedigend durchzuführen. Auch Bortz behandelt die nichtlineare Regression und vor allem deren inferenzstatistische Absicherung nur am Rande, da er sie als sehr komplex einstuft.[2]

Aufgrund der theoretischen Ausführungen und der Hypothesenformulierung wäre ein „Herauspartialisieren“ einzelner Variablen die eleganteste Lösung gewesen. Aufgrund von Hinweisen von Dr. Blasius wurde von diesem Verfahren jedoch abgesehen und die eigentlich „herauszupartialisierenden“ Faktoren mit in die multiple Regression hereingenommen. Mathematisch ist das Ergebnis äquivalent, da bei der multiplen Regression jeweils alle bis auf einen Regressor gleich null gesetzt werden. Darüber hinaus wird die multiple Regression von SPSS besser unterstützt als das „Herauspartialisieren“.

Folgende Regressionen wurden durchgeführt:

1.a Regressoren: ABWPOURX Regressand: ABWAFF2X

REIZBEX1

GEWTR_1

1.b Regressoren: ABWPOURX Regressand: ABWAFF2X

REIZBEX1

GEWTR_1

INVOLV_X

(GEWTR_1 ist die transformierte Variable GEWOEH_X. Zu diesem Zweck wurden die Daten logarithmiert.)

2.a Regressoren: KONURS_X Regressand: RISIKO2X

RISLUSX1

GEWTR_2

2.b Regressoren: KONURS_X Regressand: RISIKO2X

RISLUSX1

GEWTR_2

INVOLV_X

(GEWTR_2 ist die transformierte Variable GEWOEH_X. Zu diesem Zweck wurden die Daten ins Quadrat gesetzt. Zwar konnte durch diese Transformation nicht die Bedingung erfüllt werden, daß die zweite Ableitung zweiten Grades ist, aus der graphischen Darstellung des Konzeptes wird jedoch deutlich, daß diese Bedingung nicht so entscheidend ist. Außerdem müßte für eine entsprechende Transformation der Wert bekannt sein, ab dem das Gefälle der Kurve überproportional zunimmt. Diese Information kann aus den vorliegenden Daten nicht entnommen werden. Ansonsten werden die mathematischen Vorgaben durch diese Transformation erfüllt.)

3. Regressoren: SUMAFF_X Regressand: GESAFF_X

(SUMAFF_X ist gleich der Summe aus ABWAFF2X und RISIKO2X.)

4. Regressoren: SUMAFF_X Regressand: WKW_X

(Bei der Durchführung dieser Regression wurden zuvor mit der Bedingung „EXTRI_3 ne 1“ die Daten herausgefiltert, die aufgrund einer extrinsischen Motivation keine zufriedenstellenden Ergebnisse erwarten ließen. In die Analyse gingen daraufhin 38 Frauen und 50 Männer ein.)

5. Regressoren: GESAFF_X Regressand: WKW_X

6. Regressoren: ABWPOURX Regressand: ABAFKONX

REIZBEX1

GEWTR_1

Alle Auswertungen wurden jeweils getrennt nach Geschlechtern durchgeführt. Kurzversionen der Outputs sind im Anhang zu finden. Die nicht explizit im folgenden besprochenen Parameter können dort nachgelesen werden.

[1] Dr. J. Blasius, Mitarbeiter im Zentralarchiv für empirische Sozialforschung war so freundlich, sich für mich Zeit zu nehmen und mich bezüglich der Auswertung der Daten zu beraten.

[2] vgl.: Bortz, J., (1993), S. 187

23. Mai 201523. Mai 2018

Spezifizierung des Modells

Grundsätzlich ist die Voraussetzung für die Durchführung der Regressionsanalyse, daß das Regressionsmodell korrekt spezifiziert ist. Wenn dies nicht der Fall ist, dann ist von vornherein keine Abhängigkeit zu erwarten oder gefundene Abhängigkeiten können Artefakte sein. Zur Aufstellung eines Regressionsmodells ist also eine umfangreiche Vorarbeit notwendig.

Bei allen oben dargestellten Modellen wird aufgrund der umfangreichen theoretischen Vorarbeiten davon ausgegangen, daß sie korrekt spezifiziert sind. Dabei steht fest, wie schon am Anfang der Untersuchung ausgeführt wurde, daß ein Verhalten oder auch eine Einstellung von einer unübersehbar großen Anzahl von Faktoren beeinflußt wird. Diese konnten und sollten nicht alle Gegenstand dieser Untersuchung sein. „Eine vollständige Modellformulierung setzt im Prinzip das Vorhandensein erschöpfenden theoretischen Wissens über den untersuchten Zusammenhang voraus. Dieses ist jedoch aus wissenschaftstheoretischen Überlegungen heraus prinzipiell niemals möglich, sodaß das Postulat der Vollständigkeit immer nur als Leitidee zu verstehen ist.“[1]

Auf der anderen Seite wird aufgrund der theoretischen Vorarbeiten davon ausgegangen, daß die Faktoren, die mit in das Modell einbezogen wurden, einen Erklärungsgehalt für dasselbe haben.

[1] Backhaus, K.; Erichson, B.; Plinke, W.; Weiber, R., (1994), S. 31

23. Mai 201523. Mai 2018

Skalenniveau

Die Anwendung der Kleinst-Quadrate-Schätzung im Rahmen der Regressionsanalyse, setzt sowohl für die abhängige, als auch für die unabhängigen Variablen metrisches Skalennivau voraus.

Die im Fragebogen hauptsächlich verwendeten Rating-Skalen können nicht grundsätzlich als Intervallskalen, also als metrische Skalen bezeichnet werden. Es ist jedoch üblich von diesen anzunehmen, sie seien intervallskaliert und sie dann auch entsprechend zu behandeln.[1] „Hinter dieser ‚liberalen‘ Auffassung steht die Überzeugung, daß die Bestätigung einer Forschungshypothese durch die Annahme eines falschen Skalenniveaus eher erschwert wird.“[2] Dies ist in dieser Untersuchung umso berechtigter, als durch Verbindung mehrerer Items, von denen einige Intervallskalenniveau haben, die Annahme der Intervallskalierung noch bestärkt wird.

Bei den folgenden Untersuchungen wird deshalb davon ausgegangen, daß die verwendeten Daten intervallskalliert sind.

[1] vgl.: Backhaus, K.; Erichson, B.; Plinke, W.; Weiber, R. (1994), S. XIV

[2] Bortz, J., (1993), S. 27

23. Mai 201523. Mai 2018

Test auf Autokorrelation und Heteroskedastizität

Ein wichtiger Bestandteil der Regressionsanalyse sind die Residuen. Diese müssen eine ganze Reihe von Bedingungen erfüllen, damit die Schätzungen durch die Regressionsanalyse effizient sind.

Eine Prämisse des Regressionsmodells fordert, daß die Residuen, die ihre Ursache in den Störgrößen haben, nicht miteinander korrelieren. Wenn diese Prämisse nicht erfüllt ist, sprechen wir von Autokorrelation. Bei Zeitreihenanalysen gibt es eine sinnvolle Reihenfolge der Daten, wodurch zum Beispiel eine serielle Korrelation leicht nachgewiesen werden kann. Bei Querschnittsdaten ist die Reihenfolge der Fälle beliebig. „Das führt dazu, daß dort vorhandene Korrelationen kaum zu identifizieren sind.“[1] Aus diesem Grunde wird der Durbin/Watson-Test-Wert, der als Maßzahl der Autokorrelation üblich ist nicht berechnet. Dieser Test hat die Reihenfolge der Residuen der Beobachtungswerte zum Gegenstand der Analyse. Die Ausgangsdaten können aber durch Umstellung der Fälle beliebig geändert werden. Da die Reihenfolge der Eingabe der einzelnen Fälle rein zufällig erfolgte, hätte der Durbin/Watson-Test keine Aussagekraft. Es wird aus diesem Grunde angenommen, daß keine Autokorrelation besteht.

Eine weitere Voraussetzung des Regressionsmodells ist, daß die Varianz der Residuen homogen ist, das heißt, daß keine Heteroskedastizität vorliegt. Mit anderen Worten bedeutet dies, daß die Residualgröße nicht vom Betrag oder der Reihenfolge der Beobachtungen der unabhängigen Variablen beeinflußt werden darf.[2] Um diese Bedingung überprüfen zu können, eignen sich die standardisierten und studentisierten Residuen am besten.[3] Sowohl Backhaus[4], als auch Kockläuner[5] schlagen in erster Linie die Überprüfung dieser Bedingung mit Hilfe graphischer Hilfsmittel vor.

Wie oben schon ausgeführt, kann eine Abhängigkeit von der Reihenfolge der Beobachtungen ausgeschlossen werden. Zu überprüfen bleibt eine unter Umständen vorhandene Abhängigkeit vom Betrag. Die studentisierten Residuenwerte sind aufgrund ihrer Konstruktion mit den Vorhersagewerten leicht korreliert. Dies stört in diesem Fall jedoch nicht, da es nur darauf ankommt, daß die Residuenwerte mit konstanter Streuung zufällig um Null verteilt sind. Wenn sich in einem Streudiagramm eine abhängig von den Vorhersagewerten variierende Streuung der studentisierten Residuen findet, dann deutet das auf eine Verletzung der Annahme von Homoskedastizität hin.[6]

Sämtliche Diagramme zu den oben angegebenen Regressionen wurden überprüft. Keines der Streudiagramme läßt eine deutliche Abhängigkeit der Varianz von den Vorhersagewerten erkennen. Damit gilt die Bedingung der Homoskedastizität für alle Regressionsmodelle als erfüllt.

[1] Kockläuner, Gerhard, (1988), S. 70

[2] Backhaus, K.; Erichson, B.; Plinke, W.; Weiber, R. (1994), S. 35

[3] vgl.: Kockläuner, Gerhard, (1988), S. 67

[4] vgl.: Backhaus, K.; Erichson, B.; Plinke, W.; Weiber, R., (1994), S. 35

[5] vgl.: Kockläuner, Gerhard, (1988), S. 67

[6] vgl.: Kockläuner, Gerhard, (1988), S. 67

23. Mai 201523. Mai 2018

Test auf Multikollinearität

Eine weitere Voraussetzung für die Anwendbarkeit des Regressionsmodells ist die Abwesenheit von Multikollinearität zwischen den unabhängigen Variablen. Das bedeutet, daß sich ein Regressor nicht als Linearkombination der übrigen Regressoren darstellen lassen darf. Multikollinearität wird erst dann zum Problem, wenn eine starke lineare Abhängigkeit zwischen den Regressoren besteht.[1] Bei zwei Regressoren reicht es aus, anhand der Korrelationsmatrix zu überprüfen, ob Korrelationen bestehen. Bei drei oder mehr Regressoren läßt sich dieses Kriterium durch die Auswertung der Toleranzen der Regressoren klären. Diese berechnen sich aus: 1-Bestimmtheitsmaß einer Regressionsanalyse aller unabhängigen Variablen mit der jeweils zu untersuchenden unabhängigen Variablen als Regressand und den übrigen unabhängigen Variablen als Regressoren. Toleranzen nahe null deuten auf eine Multikollinearität der unabhängigen Variablen der eigentlichen Regressionsanalyse hin.[2]

weiblich

männlich

Regression

Regressoren

Toleranz

1.a

GEWTR_1

ABWPOURX

REIZBEX1

.963218

.961361

.914029

.983572

.909303

1.b

GEWTR_1

ABWPOURX

REIZBEX1

INVOLV_X

.833641

.940086

.957451

.814981

.784801

.967400

.904410

.765636

2.a

GEWTR_2

KONURS_X

RISLUSX1

.972883

.990093

.974331

.956431

.992608

.949542

2.b

GEWTR_2

KONURS_X

RISLUSX1

INVOLV_X

.701395

.988905

.962020

.720584

.786629

.991166

.945452

.803569

GEWTR_1

ABWPOURX

REIZBEX1

.963218

.993834

.961361

.914029

.983572

.909303

Tab. 2 (Toleranzen)

„Eine exakte Grenze für ‚ernsthafte Multikollinearität‘ läßt sich nicht angeben.“[3] Bei derart hohen Werten, wie sie sich in der oben abgedruckten Übersicht finden, kann eine starke Kollinearität ausgeschlossen werden. Auffällig sind lediglich die Werte des Involvements und die Werte der Gewöhnung, wenn das Involvement mit in die Untersuchung einbezogen wird. Im weiteren wird davon ausgegangen, daß keine Multikollinearität zwischen den unabhängigen Variablen besteht.

[1] vgl.: Backhaus, K.; Erichson, B.; Plinke, W.; Weiber, R. (1994), S. 33

[2] vgl.: Backhaus, K.; Erichson, B.; Plinke, W.; Weiber, R. (1994), S. 41

[3] Backhaus, K.; Erichson, B.; Plinke, W.; Weiber, R. (1994), S. 42

23. Mai 201523. Mai 2018

Normalverteilung der Variablen in der Grundgesamtheit

Voraussetzung für die Anwendung von t-Test und F-Test im klassischen Regressionsmodell ist eine Normalverteilung der Residuen. Diese Normalverteilungsannahme ist zur Kleinst-Quadrate-Schätzung der Koeffizienten des linearen Regressionsmodells an sich nicht erforderlich. Wenn diese Annahme jedoch erfüllt ist, ist der Kleinst-Quadrate-Schätzer identisch mit dem Größte-Dichte-Schätzer (=Maximum-Likelihood-Schätzer).[1]

Sowohl Backhaus[2] als auch Kockläuner[3] empfehlen zur Überprüfung der Normalverteilungsannahme die Überprüfung anhand von graphischen Hilfsmitteln. Zu diesem Zweck bieten sich vor allem zwei graphische Unterstützungen an. An erster Stelle steht hier das Histogramm der standartisierten Residuenwerte, das über den Regressionsbefehl von SPSS zu erreichen ist. Dabei wird die Verteilung der Residuenwerte einer stilisierten Normalverteilung gegenübergestellt. Auf der anderen Seite stellt SPSS unter dem Regressionsbefehl den Normal Probability (P-P) Plot zur Verfügung. Dieses Diagramm entsteht dadurch, daß die vorliegenden standartisierten Residuenwerte der Größe nach geordnet werden, um auf der vertikalen Achse die zugehörigen Werte ihrer empirischen Verteilungsfunktion abtragen zu können. Auf der horizontalen Achse werden diesen die Funktionswerte der standartisierten Normalverteilung gegenübergestellt. Dies ist die empirische Verteilungsfunktion der Erwartungswerte von n Ordnungsstatistiken. Letztere ergeben sich aus der größenmäßigen Anordnung von n unabhängigen standartisierten normalverteilten Zufallsvariablen. Prozentpunkte deren Verteilung liefern die angesprochenen Erwartungswerte. Normal Probability Plots sind dann wie folgt zu interpretieren: Nach Konstruktion der Achsen sind alle Koordinatenpaare immer dann auf der stilisierten Gerade liegend zu erwarten, wenn die eingehenden Beobachtungen Realisationen unabhängig standardisierter normalverteilter Zufallsvariablen darstellen.[4]

Grundsätzlich ist davon auszugehen, daß die Normalverteilungsannahme in der Regel verletzt sein wird, weil Normalverteilungen in der Realität kaum vorkommen. Der zentrale Grenzwertsatz liefert aber die Argumentation dafür, daß die Störgrößen im Regressionsmodell wenigstens als näherungsweise normalverteilt gelten können.[5] In diesem Zusammenhang ist jedoch die Gefahr der Supernormalität zu beachten. Kurz zusammengefaßt ist darunter zu verstehen, daß bei großen Stichproben die Residuenwerte als gewichtete Summe der Störgrößen auch dann annähernd normalverteilt sein können, wenn die Störgrößen nicht einer Normalverteilung genügen. Daher läßt die Verteilung der Residuen oft nicht die Verletzung der Normalverteilungsannahme erkennen. Hinzu kommt in dieser Untersuchung, daß die Konstrukte aus mehreren Items gebildet werden, was die Nicht-Normalität weiter verschleiert. „Trotzdem bleibt diese Verteilung das einzige Instrument zur Überprüfung der Normalverteilungsannahme, die für alle n Störgrößen ui und damit n einzelne Verteilungen gelten soll.“[6] Auf die weiteren statistischen Bedingungen für die Überprüfung der Normalverteilungsannahme wird an dieser Stelle nicht eingegangen, da diese statistischen Feinheiten nicht Thema einer inhaltlichen Arbeit sein können und den Umfang der Arbeit sprengen würden. Der interessierte Leser sei auf Kockläuner[7] verwiesen. Nur soviel soll hier angemerkt werden: Für die Überprüfung der Normalitätsannahme werden die intern studentisierten Residuen betrachtet, um konstante Varianzen sicherzustellen[8]. Außerdem sollte die Normalitätsbedingung nach Kockläuner die zuletzt zu überprüfende Bedingung sein. Dies hat den Vorteil, daß nicht von n einzelnen Verteilungen, also für jede einzelne Störgröße eine, ausgegangen werden muß, zu denen jeweils nur ein Residuenwert zur Verfügung steht, sondern von einem Verteilungsmodell, zu dessen Überprüfung n Residuenwerte vorliegen.[9]

Die Überprüfung der graphischen Darstellungen führte zu folgenden Ergebnissen: Weitgehend lassen die Normal Probability Plots und vor allem die Histogramme eine relativ gute Anpassung an die Normalverteilung erkennen. Stärkere Abweichungen sind vor allem bei der 3. Regression und männlichem Geschlecht und bei der 5. Regression und weiblichem Geschlecht zu erkennen. Die Graphiken sind nicht in dieser Arbeit abgedruckt, können jedoch mit Hilfe der Syntax auf der beigefügten Diskette problemlos dargestellt werden.

Zur Überprüfung der Residuen auf Normalverteilung, soll zusätzlich der Kolmogorov-Smirnov-Anpassungstest durchgeführt werden. Dieser ist für kleine Stichproben besser geeignet als der -Test, da letzterer nur approximativ arbeitet.[10] Im Falle eines Ablehnens der Normalverteilungsannahme durch diesen, kann im Anschluß noch eine weitere Verteilungsüberprüfung über Schiefe und Exzeß durchgeführt werden.

Die H0 des Kolmogoroff- Smirnov-Anpassungstest lautet, daß die empirisch ermittelte Verteilung gleich der Normalverteilung ist. Die Alternativhypothese lautet, daß sich die beiden Verteilungen für mindestens einen Wert der unabhängigen Variable unterscheiden. Die Hypothese H0 wird nun zum Niveau verworfen, wenn Dn multipliziert mit der Wurzel aus der Anzahl der Beobachtungen, größer oder gleich dem aus der Tabelle[11] zu entnehmenden kritischen Wert ist. „Die Größe Dn gibt den größten vertikalen Abstand zwischen hypothetischer und empirischer Verteilungsfunktion an.“[12] Nun ist das Signifikanzniveau zu bestimmen. Üblicherweise wird ein Signifikanzniveau von 1% oder 5% gewählt. An dieser Stelle ist zu beachten, daß es hier darum geht, die Normalverteilungsannahme zu überprüfen und dabei den -Fehler, das heißt eine fälschliche Beibehaltung der Nullhypothese zu minimieren. Da sich der -Fehler aus 1- -Fehler berechnet, erscheint es sinnvoll, das Signifikanzniveau an dieser Stelle höher anzusetzen. Im Rahmen der dieser Arbeit wird deshalb ein Signifikanzniveau von 10% zur Ablehnung der Normalverteilungsannahme angesetzt.

weiblich

männlich

Regression

K-S-z

Signif.-Niveau

K-S-z

Signif.-Niveau

1.a

1.1021

.1761

0.8518

.4626

1.b

0.4965

.9662

0.6876

.7317

2.a

0.8341

.4898

1.0320

.2373

2.b

1.0907

.1851

0.7863

.5666

1.0867

.1884

1.1211

.1618

0.7999

.5444

0.7258

.6680

1.0018

.2681

0.6126

.8472

0.9536

.3230

0.7569

.6156

Tab. 3 (Kolmogoroff-Smirnov-Test-Wert)

Für sämtliche Regressionen liegen die Kolmogoroff-Smirnov-z-Prüfgrößen und die entsprechenden Signifikanzniveaus über dem geforderten Mindestmaß[13]. Kritisch sind vor allem die Kolmogoroff-Smirnov-z-Prüfgrößen für die Regression 1.a (weiblich), die Regression 5. (weiblich), da hier ja nur 38 Werte in die Untersuchung eingehen und Regression 3. (männlich). Die Normalverteilungsannahme für die Residuenwerte wird trotzdem für alle Regressionen als bestätigt angesehen. Auch das dritte und fünfte Regressionsmodell werden weiter verfolgt, auch wenn vor allem bei dem dritten Modell die Werte auf eine schlechte Erfüllung der Normalverteilungsannahme hindeuten.

[1] vgl.: Gruber, Josef, (1982), S. 58

[2] vgl.: Backhaus, K.; Erichson, B.; Plinke, W.; Weiber, R., (1994), S. 32

[3] vgl: Kockläuner, Gerhard, (1988), S. 58 ff

[4] vgl.: Kockläuner, Gerhard, (1988), S. 58 ff

[5] vgl.: Hartung, J., (1982), S. 122

[6] Kockläuner, Gerhard, (1988), S. 73

[7] Kockläuner, Gerhard, (1988), S. 60-76

[8] vgl.: Kockläuner, Gerhard, (1988), S. 63

[9] Kockläuner, Gerhard, (1988), S. 73

[10] vgl.: Hartung, J., (1982), S. 183

[11] vgl.: Hartung; J. (1982), S. 184

[12] Hartung; J. (1982), S. 184

[13] vgl.: Hartung; J. (1982), S. 184