< Zurück   INHALT   Weiter >

4.2.2 Exkurs: Latente Wachstumsmodelle als Mehr-EbenenModelle

Seit der Jahrtausendwende haben neben den in diesem Buch behandelten Strukturgleichungsmodellen auch Mehr-Ebenen-Modelle (Gelman und Hill 2007; Hox 2010; Langer 2009; Steenbergen und Jones 2002) immer mehr an Bedeutung für die politikwissenschaftliche Forschung gewonnen. Beide Verfahren sind enger verwandt, als es zunächst den Anschein hat, weil sie sich in einem übergeordneten Ansatz zur Analyse latenter Variablen zuordnen lassen (Muthèn 2002; Skrondal und Rabe-Hesketh 2004).

Während herkömmliche Regressionsmodelle die Fälle als vollständig unabhängig voneinander betrachten, bilden Mehr-Ebenen-Modelle die Abhängigkeiten, die sich aus der Struktur der Daten bzw. der Datenerhebung ergeben, explizit ab. So kann man sich beispielsweise vorstellen, dass auf der individuellen Ebene ein Zusammenhang zwischen der allgemeinen Links-Rechts-Selbsteinstufung und der Ablehnung von Zuwanderern besteht: Je weiter rechts sich ein Befragter einordnet, desto stärker dürfte er oder sie ceteris paribus auch Immigranten ablehnen. Dabei ist jedoch zu erwarten, dass sich Befragte, die im selben Wahlkreis leben, im Mittel

Abb. 4.5 Mehr-Ebenen-Struktur: Schachtelung von Wählern in Wahlkreisen

ähnlicher sind als Befragte aus unterschiedlichen Wahlkreisen, weil sie gemeinsamen unbeobachteten Einflüssen ausgesetzt sind. In diesem Sinne sind Befragte aus demselben Wahlkreis nicht mehr unabhängig voneinander.

In der Terminologie der Mehr-Ebenen-Modellierung bilden die Befragten die erste Ebene des Modells. Jeder Befragte lebt in genau einem der Wahlkreise, die die zweite Ebene des Modells bilden (siehe Abb. 4.5) [1]. Dieser Zusammenhang wird als Schachtelung („nesting“) bezeichnet [2]. Elemente auf der oberen Ebene (Wahlkreise) werden einfach, Elemente auf der unteren Ebene (Wähler) hingegegen doppelt indiziert: Bei der Person mit dem Index i = 3 und j = 1 handelt es sich um den dritten Befragten im ersten Wahlkreis.

Die Schachtelung kann unterschiedliche Konsequenzen haben. Dabei sind zwei Mechanismen besonders wichtig. Zunächst kann sich aufgrund zufälliger und nicht beobachteter Einflüsse (politische Ereignisse, Wirtschaftsstruktur, Berichterstattung in der Lokalpresse etc.) das allgemeine Niveau der Ablehnung von Zuwanderern zwischen den Wahlkreisen unterscheiden, so dass jeder Wahlkreis seinen eigenen Achsenabschnitt hat, der zufällig nach oben oder unten vom allgemeinen Achsenabschnitt abweicht.

Subtiler ist ein zweiter Mechanismus: In Abhängigkeit von der Polarisierung durch politische Prozesse im Wahlkreis kann der individuelle Zusammenhang zwischen der Links-Rechts-Selbsteinstufung und der Ablehnung von Zuwanderern über die Wahlkreise hinweg variieren, so dass es auch hier zu einer als zufällig betrachteten Abweichung vom allgemeinen Wert kommt.

yij = β0j + β1j x1ij + e0ij (4.3)

Gleichung (4.3) zeigt in allgemeiner Form, wie ein solches Zwei-Ebenen-Modell konstruiert werden kann [3]. Zu beachten ist hier zunächst, dass auch die Variablen doppelt indiziert sind: i bezieht sich auf die Ebene der Befragten, j auf die Ebene der Wahlkreise. Dementsprechend ist die personenspezifische Variable yij (hier: Einstellungen zu Migranten) eine Funktion der kontextspezifischen Konstante β0j , der personenspezifischen Variable x1ij (hier: Links-Rechts-Selbsteinstufung), der kontextspezifischen Steigung β1j und der zufälligen Einflüsse auf der Personenebene e0ij . Letztere sind wie im einfachen linearen Regressionsmodell unabhängig voneinander und mit konstanter Varianz σ 2 verteilt (Gl. (4.6)) [4].

Die spezifische Mehr-Ebenen-Struktur des Modells zeigt sich in Gl. (4.4) und (4.5): Innerhalb jedes Wahlkreises j ist der Achsenabschnitt β0j eine Funktion des allgemeinen Achsenabschnitts β0 und der zufälligen Einflüsse u0j , die identisch

und unabhängig mit einer Varianz σ 2 verteilt sind. In ähnlicher Weise variiert auch die Steigung, d. h. der Effekt der Links-Rechts-Selbsteinstufung über die Wahlkreise: Der Koeffizient β1j ist eine Funktion der allgemeinen Steigung β1 sowie einer dritten Serie zufälliger Einflüsse, die unabhängig voneinander mit konstanter Varianz σ 2 verteilt sind.

Im Ergebnis schätzt ein solches Modell für jeden Wahlkreis bzw. allgemeiner für jedes Element der höheren Ebene eine eigene Regressionsgerade, ist dabei aber effizienter als es eine separate Modellierung auf Wahlkreisebene wäre (Gelman und Hill 2007): Statt einer sehr großen Zahl inhaltlich wenig interessanter wahlkreisspezifischer Koeffizienten werden ein allgemeines Modell sowie die Parameter der Verteilung der wahlkreisspezifischen Koeffizienten um diese Mittelwerte geschätzt.

Nicht von ungefähr erinnern solche wahlkreisspezifischen Regressionsgeraden an die personenspezifischen Wachstumskurven aus den Abb. 4.2 und 4.4, denn auch die in Abschn. 4.2.1 vorgestellten Paneldaten weisen eine typische ZweiEbenen-Struktur auf: Die einzelnen Interviews bilden die untere Ebene und sind innerhalb der Befragungspersonen auf der zweiten Ebene geschachtelt. Vor diesem Hintergrund lässt sich Gl. (4.2) auch als Zwei-Ebenen-Modell schreiben:

intij =β0j + β1j × tij + e0ij (4.9)

mit β0j = β0 + u0j (4.10)

β1j = β1 + u1j . (4.11)

In dieser Perspektive entspricht β0 dem Mittelwert der Variablen I und β1 dem Mittelwert der Variablen S. σ 2ist das Gegenstück zur geschätzten Varianz von I , und σ 2 tritt an die Stelle der geschätzten Varianz von S. Die Schätzwerte selbst sind identisch.

Auch wenn es auf den ersten Blick irritierend erscheinen mag, dass Personen hier nicht die untere, sondern die obere Ebene des Modells darstellen, bietet dieser Ansatz einige Vorteile. So ist es aus der Perspektive der Mehr-Ebenen-Analyse keineswegs erforderlich, dass die Zahl der Einheiten auf der unteren Ebene, die in jeder Einheit der oberen Ebene enthalten ist, identisch ist. In dem obengenannten Beispiel wäre es kein Problem, wenn in einem großen Wahlkreis mehr, in einem kleinen Wahlkreis hingegen weniger Personen befragt werden. In ähnlicher Weise ist es bei der Analyse von Paneldaten mit einem Mehr-Ebenen-Modell nicht erforderlich, dass das Panel balanciert ist. Personen mit einer unvollständigen Zahl von Beobachtungen werden in transparenter Weise in die Analyse mit einbezogen, ohne dass man als Benutzer besondere Vorkehrungen treffen muss.

Allerdings lässt sich das Problem unbalancierter Paneldaten auch innerhalb des in Abschn. 4.2.1 vorgestellten Ansatzes lösen, indem ein geeignetes Schätzverfahren wie das FULL INFORMATION MAXIMUM-LIKELIHOOD-VERFAHREN (FIML) eingesetzt oder die Daten vorab durch ein Imputationsverfahren ergänzt werden. Noch wichtiger ist deshalb ein zweiter Vorteil: Da die Zeit in Gl. (4.9) nicht mehr wie in Gl. (4.2) durch die Welle definiert und auf bestimmte Werte fixiert ist, sondern als individuelle Variable auftaucht, ist es nicht notwendig, dass alle Befragten einer Welle am selben Tag befragt werden [5].

Aus der Kombination beider Eigenschaften ergibt sich, dass bei Bedarf die traditionelle Panelstruktur ganz aufgegeben werden kann: In einem rollierenden Design können beispielsweise verschiedene Personen unterschiedlich häufig und zu verschiedenen Zeitpunkten befragt werden. Auch der Startpunkt des Wachstumsprozesses t = 0 kann für jede Person individuell festgelegt werden, beispielsweise auf das Erreichen der Wahlberechtigung oder den Eintritt in eine politische Partei. Ein Nachteil der Mehr-Ebenen-Modellierung von Wachstumsprozessen besteht allerdings darin, dass diese univariat erfolgt. Die simultane Schätzung von Messund strukturellen Modellen lässt sich somit nicht realisieren.

Um den in Abschn. 4.2.1 vorgestellten Wachstumsprozess als Mehr-EbenenModell zu schätzen, muss der Datensatz zunächst umstrukturiert werden. Paneldaten können in zwei unterschiedlichen Varianten gespeichert werden. Im „breiten“ (wide) Format entspricht jede Zeile der Datenmatrix genau einem Fall. Die Beobachtungen aus den einzelnen Panelwellen werden jeweils in eigenen Variablen gespeichert, so dass der Datensatz mit jeder neuen Welle breiter wird. Abbildung 4.6a zeigt diese Anordnung für die Daten zum politischen Interesse. Um das Strukturgleichungsmodell aus Abschn. 4.2.1 zu schätzen, müssen die Daten in dieser Form vorliegen, da die fünf Messungen jeweils als eigenständige Variable im Modell auftauchen (vgl. Abb. 4.3).

In der „langen“ Form hingegen entspricht jede Zeile in der Datenmatrix einer Beobachtung. Mit jeder neuen Panelwelle wird der Datensatz länger. Deshalb wird zwingend eine Variable benötigt, die die Person identifiziert. Nur so lässt sich erkennen, welche Beobachtungen zusammengehören. Wenn eine Person an einer Panelwelle nicht teilnimmt, generiert dies in der breiten Form fehlende Werte bei den entsprechenden Variablen. In der langen Form dagegen fehlt einfach eine Zeile. Das Mehr-Ebenen-Modell benötigt die Daten in der langen Form, da es hier nur eine einzige Variable für das Interesse gibt und der Zeitpunkt der Messung

id

int1

int2

•••

t1

t2

•••

1

4

5

• ••

0

14

• ••

2

1

2

• ••

0

14

• ••

..

.

..

.

..

.

..

.

..

.

..

.

..

.

(a) „Breite“ (wide) Anordnung

id int t

1 4 0

1 5 14

. . .

. . .

2 1 0

2 2 14

. . .

. . .

(b) „Lange“ (long) Anordnung

Abb. 4.6 Mögliche Anordnungen von Paneldaten

1 use interesse panel , clear

2 rename int * interesse *

3 reshape long tn interesse , i( id) j( wave )

4 mixed interesse tn || id: tn , cov ( unstructured )

Listing 4.8 Latent Growth Model (Mehr-Ebenen-Spezifikation) des politischen Interesses im Wahlkampf in Stata

nicht als Restriktion für einen Pfadkoeffizienten, sondern als Variable im Modell auftaucht. Stata verfügt mit reshape über einen leistungsfähigen Befehl, um die Anordnung von Paneldatensätzen zu verändern. Bevor dieser zum Einsatz kommen kann, müssen die Variablen int1-int5 jedoch in interesse1-interesse5 umbenannt werden, da es sonst zu Verwechslungen zwischen dem Namen der Variablen und dem Schlüsselwort int, das für den Typ der ganzzahligen Variablen steht, kommen würde. Diese Umbenennung wird in Zeile 2 von Listing 4.8 vorgenommen, die zeigt, wie sich mit Hilfe des Jokerzeichens * Gruppen von Variablen mit ähnlichen Namen umbenennen lassen. Der reshape-Befehl selbst benötigt zunächst das Schlüsselwort long, das die gewünschte Anordnung der Daten angibt. Darauf folgen jeweils der Stamm der Namen beider Variablen, die vom breiten in das lange Format gebracht werden sollen. Andere Variablen wie die formale Bildung, das Alter in Jahren und die Identifikationsnummer, die von Welle zu Welle konstant bleiben, müssen hier nicht gesondert aufgeführt werden. Abgeschlossen wird der Befehl mit den beiden durch das Komma abgetrennten Optionen. Mit i(id) wird festgelegt, dass die Variable id die Befragten eindeutig identifiziert. Die Option j(wave) erzeugt eine neue Variable wave, die die Nummer der Befragungswelle enthält. Diese wird aus dem numerischen Bestandteil der Variablennamen interesse1-interesse5 und tn1-tn5 abgeleitet.

Nach diesen Vorbereitungsarbeiten kann in Zeile 4 das Modell geschätzt werden. Der Befehl dafür heißt mixed bzw. bis einschließlich Version 12 xtmixed. Hinter dem Namen des Befehls folgen in Zeile 4 zunächst der Name der abhängigen Variablen interesse und der unabhängigen Variable tn. Dies entspricht einer „normalen“ linearen Regression des politischen Interesses auf die seit Beginn der Untersuchung vergangene Zeit. Ohne die weiteren Anweisungen in Zeile 4 würde Stata die Parameter dieses einfachen Regressionsmodells schätzen [6]. Dieser erste Teil des Modells wird in der Terminologie der Mehr-Ebenen-Analyse auch als „fixed part“ bezeichnet und entspricht Gl. (4.3). Hinter dem ||-Zeichen folgt dann der „random part“ des Modells, der das Gegenstück zu Gl. (4.4) und (4.5) darstellt. Der Ausdruck id: legt die Person als zweite Ebene fest und schätzt einen Achsenabschnitt, der auf dieser zweiten Ebene zufällig variiert. Die Variable tn wird auf dieser zweiten Ebene nochmals aufgeführt. Dies signalisiert, dass der Achsenabschnitt frei über die Personen variieren soll. Die Option cov(unstructured) schließlich legt fest, dass keine Annahmen über die Varianz-Kovarianzmatrix der beiden zufälligen Effekte getroffen werden sollen, sondern diese Parameter frei geschätzt werden. Ohne diese Option würde die Kovarianz zwischen beiden Effekten auf den Wert 0 fixiert.

Ausgabe 6 zeigt das Ergebnis der Schätzungen. Auffällig ist hier zunächst die große Zahl der Beobachtungen (17.555). Diese ergibt sich aus der Überführung des Datensatzes in die „lange“ Form. Die Zahl der „Gruppen“ ist deutlich kleiner. Bei diesen „Gruppen“ handelt es sich selbstverständlich um die 3511 Befragten, die hier als übergeordnete Einheiten betrachtet werden. Für jeden dieser Befragten liegen jeweils alle Antworten vor, so dass die Zahl der Beobachtungen über alle Befragten hinweg konstant bei fünf liegt. Wie oben skizziert, würde das Fehlen

. mixed interesse tn || id: tn , cov(unstructured) Performing EM optimization:

Performing gradient-based optimization:

Iteration 0: log likelihood =

-20220.099

Iteration 1: log likelihood =

-20219.46

Iteration 2: log likelihood =

-20219.46

Computing standard errors:

Mixed-effects ML regression

Number of obs

=

17555

Group variable: id

Number of groups

=

3511

Obs per group: min

=

5

avg

=

5.0

max

=

5

Wald chi2(1)

=

11.71

Log likelihood = -20219.46

Prob > chi2

=

0.0006

interesse

Coef.

Std. Err.

z

P>|z|

[95% Conf. Interval]

tn

.000822

.0002402

3.42

0.001

.0003513

.0012928

_cons

3.078772

.0175915

175.01

0.000

3.044294

3.113251

Random-effects Parameters

Estimate

Std. Err.

[95% Conf. Interval]

id: Unstructured

var(tn) var(_cons) cov(tn,_cons)

.0000661

.9037177

-.0015144

5.19e-06

.0260541

.0002731

.0000566

.8540685

-.0020497

.0000771

.9562531

-.0009792

var(Residual)

.3160283

.0043548

.3076073

.3246798

LR test vs. linear regression: chi2(3) = 12850.16 Prob > chi2 = 0.0000 Note: LR test is conservative and provided only for reference.

Ausgabe 6: Mehr-Ebenen-Modellierung der Zunahme des politischen Interesses im Wahlkampf in Stata

einzelner Werte aber kein Problem darstellen, so lange diese Ausfälle als zufällig betrachtet werden können. In diesem Fall wäre die durchschnittliche Zahl der Beobachtungen einfach etwas niedriger.

Die Parameterschätzungen selbst sind mit denen aus Ausgabe 4 (fast [7]) identisch, auch wenn die Zuordnung nicht sofort offensichtlich ist. Der Wert des Achsenabschnitts (_cons) entspricht dem Mittelwert der Variablen I im Strukturgleichungsmodell, der Wert des Steigungskoeffizienten (tn) dem Mittelwert der Variablen S. Die Varianzen und die Kovarianz der latenten Variablen finden sich im Tabellenfeld id: Unstructured wieder. Die Residualvarianz ganz unten in der

1 Data:

2 File is latent growth ml. dat ;

3 Variable:

4 Names are

5 id interesse tn;

6 Missing are all ( -9999) ;

7 WITHIN = tn ;

8 CLUSTER = id ;

9 Analysis:

10 Type = TWOLEVEL RANDOM ;

11 Model:

12 % WITHIN %

13 s | interesse ON tn ;

14 % BETWEEN %

15 interesse WITH s ;

Listing 4.9 Mehr-Ebenen-Wachstumsmodell des politischen Interesses in Mplus

Tabelle schließlich ist gleich dem Mittelwert der separaten fünf Fehlervarianzen im Strukturgleichungsmodell [8].

Das gleiche Modell lässt sich mit den Anweisungen in Listing 4.9 auch in Mplus schätzen [9]. In Zeile 1 bis 8 werden die aus Stata exportierten Daten eingelesen und die Variablen definiert. Interessant sind hier nur Zeile 7 und Zeile 8, die festlegen, dass die Zeit auf der unteren Ebene des Modells gemessen wird und dass die Gruppen bzw. „cluster“ durch die Personenkennung in der Variablen id identifiziert werden. Zeile 10 legt fest, dass das Modell zwei Ebenen und random effects haben soll [10].

Die eigentliche Modellstruktur wird dann in den Zeilen 12 bis 15 definiert. Dabei sind zwei Blöcke zu unterscheiden: Die Anweisungen unterhalb von %WITHIN% (Zeilen 12 und 13) beziehen sich auf die untere Ebene der Beobachtungen, wäh-

rend im %BETWEEN%-Block die Unterschiede zwischen den Gruppen (=Personen)

1 TITLE = ML Wachstum ;

2 SY=' interesse panel long . LSF ';

3 ID2 = id;

4 RESPONSE = interess ;

5 FIXED = intcept tn;

6 RANDOM1 = intcept ;

7 RANDOM2 = intcept tn;

Listing 4.10 Mehr-Ebenen-Wachstumsmodell des politischen Interesses in LISREL

modelliert werden. Den Kern des Modells bildet Zeile 13, in der die lineare Beziehung zwischen politischem Interesse und der Zeit festgelegt wird. Die Anweisung s | in Kombination mit ON bedeutet, dass der Effekt der Zeit zufällig über die Befragten hinweg variieren kann, und dass der Achsenabschnitt ebenfalls zufällig variiert. Innerhalb des Ansatzes, auf dem Mplus basiert, ist s dabei als eine latente Variable zu verstehen, die den Effekt der Zeit beeinflußt und deren Name frei gewählt werden kann. In Zeile 15 wird darüber hinaus festgelegt, dass die Kovarianz zwischen der zufälligen Variation von Achsenabschnitt und Steigung frei geschätzt werden soll. Dies entspricht der Option cov(Unstructured) in Listing 4.8.

Seit Version 9 können auch mit LISREL Mehr-Ebenen-Modelle geschätzt werden. Diese können entweder interaktiv durch ein Menüsystem oder durch ein Skript definiert werden. Letzteres verwendet allerdings nicht die SIMPLIS-Syntax, sondern wird vielmehr von PRELIS verarbeitet. Listing 4.10 zeigt die Anweisungen, mit denen sich die Schätzungen aus Stata in LISREL reproduzieren lassen. In Zeile 2 werden die Daten im LISREL-internen Format eingelesen. Zeile 3 legt fest, dass die zweite Ebene durch die Personenkennung definiert wird. Zeile 4 benennt die abhängige Variable (deren Name auf acht Zeichen gekürzt wurde), während Zeile 5 und 6 das Modell auf der unteren Ebene beschreiben: Hier hängt

das Interesse von einer allgemeinen Konstante (intcept), der Zeit sowie der Residualvarianz ab. Zeile 7 enthält die zufälligen Variationen des Achsenabschnitts und der Steigung auf der oberen Ebene.

  • [1] Kompliziertere Mitgliedschaftsstrukturen sind grundsätzlich denkbar, können hier aber außer Betracht bleiben
  • [2] Diese Form der Abhängigkeit ist unabhängig von der oben in Abschn. 2.6.4 diskutierten Schachtelung von Modellen
  • [3] Die Notation zur Beschreibung von Mehr-Ebenen-Modellen ist uneinheitlich. Die hier verwendete Notation lehnt sich an Hox (2010) und das Programm MLWiN an
  • [4] Qe , Qu0 und Qu1 repräsentieren hier die Abhängigkeiten zwischen den zufälligen Einflüssen. Grundsätzlich könnte hier ein autoregressives Muster spezifiziert werden, das räumliche oder zeitliche Nähe abbildet. Hier im Beispiel wird jedoch festgelegt, dass es sich jeweils um Diagonalmatrizen handelt, deren Hauptdiagonale jeweils einen konstanten Wert enthält. Die zufälligen Einflüsse sind somit identisch und unabhängig voneinander verteilt
  • [5] In Mplus ist es auch innerhalb des multivariaten SEM-Ansatzes möglich, dass die Befragten zu unterschiedlichen Zeiten interviewt werden
  • [6] Die Ergebnisse unterscheiden sich minimal von denen des Befehls reg interesse tn, weil die Schätzungen nicht auf OLS sondern auf ML basieren
  • [7] Kleinere Abweichungen ergeben sich u. a. daraus, dass in der SEM-Variante mehr Parameter geschätzt werden
  • [8] Die übrigen Parameter des Strukturgleichungsmodells werden nicht geschätzt, sondern sind fixiert, um den erwarteten linearen Effekt der Zeit abzubilden
  • [9] Die im folgenden skizzierte Vorgehensweise reproduziert die in Stata geschätzten Ergebnisse, widerspricht aber den Empfehlungen im Mplus-Benutzerhandbuch. Dessen Autoren bevorzugen es, Wachstumsmodelle innerhalb des in Mplus implementierten flexiblen generellen Ansatzes zur Behandlung latenter Variablen als Strukturgleichungsmodelle zu schätzen
  • [10] Während Stata zahlreiche unterschiedliche Befehle für verschiedene Modelle kennt, wird die entsprechende Auswahl in Mplus durch die Kombination von Anweisungen im Analysis bzw. Model-Block getroffen
 
< Zurück   INHALT   Weiter >