Menü
Start
Anmelden / Registrieren
Suche
 
Start arrow Politikwissenschaft arrow Strukturgleichungsmodelle
< Zurück   INHALT   Weiter >

4.2 Latente Wachstumsmodelle

4.2.1 Zunahme des Interesses am Wahlkampf

Wachstumsmodelle stammen ursprünglich aus der Biologie, wo sie die direkt beobachtbare Veränderung von Größe oder Gewicht eines Individuums über die Zeit beschreiben. Latente Wachstumsmodelle hingegen modellieren die Veränderung individueller Parameter, die nicht direkt zu beobachten sind (Intelligenz, Lesefähigkeit, ...) und haben vor allem in der Entwicklungspsychologie und der empirischen Bildungsforschung weite Verbreitung gefunden. Charakteristisch für diese Form der Modellierung ist, dass die einzelnen Messungen als fehlerbehaftet angesehen werden, so dass ein direkter Bezug zu den Strukturgleichungsmodellen besteht.

Anders als bei den bisher vorgestellten Modellen wird der Wert der latenten Variablen jedoch nicht als konstant betrachtet. Vielmehr wird davon ausgegangen, dass die individuellen Entwicklungen über die Zeit einer personenspezifischen Wachstumskurve folgen, die wegen der Messfehler nicht direkt beobachtet werden kann, sondern aus den Daten extrapoliert werden muss.

Innerhalb dieses sehr allgemeinen Rahmens können in Abhängigkeit vom Erhebungsdesign und den theoretischen Grundannahmen eine Vielzahl von Modellen spezifiziert werden (für einen Überblick siehe Reinecke 2012). In der einfachsten

Version basieren diese auf einem balancierten Panel-Design und einem linearen Wachstumsmodell: Eine identische Gruppe von Personen wird vollständig und in konstanten Abständen untersucht, und es wird angenommen, dass der „Wachstums“ prozess während dieser Zeit mit einer konstanten Rate voranschreitet [1].

Häufig stellt sich dabei die Frage, wie viele Personen und wie viele Panelwellen benötigt werden, um ein solches Wachstumsmodell zu schätzen. Grundsätzlich gelten auch hier die Prinzipien, die in den Abschn. 2.6.2 und 2.6.3 skizziert wurden. Die Anwendung des ML-Verfahrens erfordert große Stichproben von wenigstens einigen hundert Fällen und eine multivariate Normalverteilung der Werte. Bei der Anwendung von WLS/ADF sollte die Stichprobe nach Möglichkeit noch größer sein. In der Literatur finden sich allerdings auch Studien, die auf deutlich kleineren Fallzahlen basieren. In diesem Fall sollten allerdings alternative Verfahren zur Schätzung von Parametern und Standardfehlern genutzt und die Ergebnisse mit großer Vorsicht betrachtet werden.

Klarer zu beantworten ist die Frage nach der minimalen Zahl der benötigten Befragungswellen. Diese ergibt sich aus der Notwendigkeit der Identifikation. Das lineare einfaktorielle Wachstumsmodell, das auf den folgenden Seiten vorgestellt wird, kann unter Annahme gängiger Restriktionen mit zwei Panelwellen nicht geschätzt werden, weil es nicht identifiziert ist: Das Modell enthält 7 Parameter (2 Fehlervarianzen, 2 Faktorvarianzen, 2 Faktormittelwerte und eine Kovarianz zwischen den Faktoren). Diesen stehen bei zwei Panelwellen aber lediglich 5 unabhängige Informationen gegenüber (eine Kovarianz, 2 Varianzen, 2 Mittelwerte). Durch einen dritte Panelwelle erhöht sich die Zahl der zu schätzenden Parameter lediglich um eine zusätzliche Fehlervarianz, während die Zahl der unabhängigen Informationen überproportional, nämlich auf 12 ansteigt (6 Kovarianzen, 3 Varianzen und 3 Mittelwerte), so dass das Modell nun identifiziert ist und 4 Freiheitsgrade zur Beurteilung der Modellgüte zur Verfügung stehen. Komplexere Wachstumsmodelle (etwa mit einem zusätzlichen quadratischen Term) erfordern in Abhängigkeit von ihrer Struktur mindestens 4, teils auch mehr Panelwellen (Bollen und Curran 2006; Preacher 2008).

Ein politikwissenschaftliches Beispiel für ein Wachstumsmodell ist die Zunahme des Interesses am Wahlkampf im Verlauf der Kampagne. Im Rahmen der nationalen Studie zur Bundestagswahl 2013 wurde eine Gruppe von rund 4000 Wahlberechtigten zwischen dem Beginn der heißen Phase der Kampagne im Juli und

Tab. 4.1 Struktur der Panelbefragung zur Bundestagswahl 2013

der Woche unmittelbar vor der Bundestagswahl am 22. September insgesamt fünf Mal zu einer Vielzahl politischer Themen sowie zu ihrem Interesse am Wahlkampf befragt [2].

Tabelle 4.1 zeigt den Aufbau des daraus resultierenden Datensatzes. Für jeden der 3511 Befragten ist das Interesse am Wahlkampf, das die betreffende Person an den fünf Befragungstagen geäußert hat, bekannt. Geht man davon aus, dass die erste Messung am 18. Juli 2013 tatsächlich den Zustand zu Beginn der Kampagne abbildet, so kann man aus dem Datum der Befragungen in den Wellen zwei bis fünf errechnen, wie viele Tage t die betreffende Person bereits den Einflüssen des Wahlkampfes ausgesetzt war.

Die möglichen Wirkungen dieser Einflüsse illustrieren drei idealtypische Verläufe in Abb. 4.2. Der erste Befragte (gepunktete Linie ganz oben) hat bereits zu Beginn des Wahlkampfes ein sehr großes Interesse, das im Verlauf der nächsten 60 Tage nochmals leicht ansteigt. Bei einem zweiten Respondenten (gestrichelte Linie in der Mitte der Abbildung) hingegen kommt es – ausgehend von einem weitaus niedrigeren Niveau – über die Dauer der Kampagne zu einer deutlich stärkeren Mobilisierung. Ein dritter Befragter schließlich (durchgezogene Linie ganz unten) ist am Ende des Wahlkampfes genauso desinteressiert wie zu dessen Beginn.

Solche glatten Kurven sind in der Realität nicht direkt zu beobachten, da jede der fünf individuellen Messungen von Fehlern überlagert ist und in diesem Beispiel

Abb. 4.2 Idealisierte individuelle Wachstumskurven

zudem auf einer eher grobschlächtigen fünfstufigen Ratingskala basiert. Mithilfe eines statistischen Modells kann ihr Verlauf aber geschätzt werden.

Um zu verstehen wie es möglich ist, nicht nur den aggregierte Anstieg des Interesses am Wahlkampf, sondern auch befragtenspezifische Kurven zu modellieren, muss man sich klarmachen, dass jede der Kurven in Abb. 4.2 durch zwei Parameter beschrieben werden kann, die dem Achsenabschnitt (Intercept oder kurz I ) und der Steigung (slope, S) eines individuellen linearen Regressionsmodells (siehe Abschn. 2.2.3) entsprechen. Der Achsenabschnitt erfasst dabei das Ausgangsniveau des Wahlkampfinteresses in der ersten Welle, während die Steigung die tägliche Zunahme des Interesses abbildet. So ist beispielsweise in der dritten Befragungswelle für jeden einzelnen Befragten ein Interesse-Wert von

int3 = 1 × I + 28 × S + E (4.1)

zu erwarten, da seit Beginn der Untersuchung 28 Tage vergangen sind (vgl. die Werte in der dritten Spalte von Tab. 4.1). Noch allgemeiner formuliert ist das Interesse einer Befragten i am Wahlkampf in der Welle w eine Funktion ihres

Abb. 4.3 Ein Latent Growth Model des Interesses am Wahlkampf

individuellen Ausgangsniveaus, der seit Beginn der Beobachtung vergangenen Zeit und ihres individuellen Steigungskoeffizienten:

intiw = Ii + Tw × Si + E (4.2)

mit

T1 = 0, T2 = 14, T3 = 28, T4 = 46, T5 = 60.

Abbildung 4.3 zeigt das zugehörige Strukturgleichungsmodell. Auffällig ist hier zunächst, dass für (fast) alle Pfade Restriktionen gesetzt sind. Diese erklären sich aber bei näherer Betrachtung aus der in Abb. 4.2 illustrierten Annahme des linearen Wachstums, durch die die Pfadkoeffizienten festgelegt sind: Jeder der fünf Messwerte ist eine Funktion des Achsenabschnitts, der Steigung, und der seit Beginn des Wahlkampfes vergangenen Zeit in Tagen (0, 14, 28, 46, 60). Der einzige Pfad, dessen Koeffizient frei geschätzt wird, ist die Kovarianz zwischen Achsenabschnitt und Steigung. Im Beispiel ist hier ein negativer Wert zu erwarten, da für Personen, die bereits zu Beginn der Kampagne sehr interessiert waren, in der Tendenz eine geringere Zunahme des Interesses, also ein schwächeres „Wachstum“ zu erwarten ist. Das Hauptinteresse bei dieser Form der Modellierung gilt jedoch nicht den Pfaden, sondern den personenspezifischen Werten der latenten Variablen sowie deren Mittelwerten.

Listing 4.4 zeigt, wie leicht sich das in Abb. 4.3 skizzierte Modell in StataSyntax abbilden lässt. Die Anweisungen in Zeile 2 erzeugen die Pfade zwischen dem Achsenabschnitt und den fünf Messwerten und fixieren deren Pfadkoeffizienten auf den Wert von 1. In Zeile 3 werden die entsprechenden Zuweisungen für die lineare Steigung vorgenommen. Von besonderer Bedeutung sind die beiden

1 use interesse panel , clear

2 sem ( I -> int1@1 int2@1 int3@1 int4@1 int5@1 ) ///

3 ( S -> int1@0 int2@14 int3@28 int4@46 int5@60 ) ///

4 , noconstant means ( I S)

Listing 4.4 Latent Growth Model (SEM) des Interesses am Wahlkampf in Stata

Optionen in Zeile 4. noconstant unterdrückt die Aufnahme einer Konstanten in das Messmodell, was auf den ersten Blick verwirrend erscheinen mag, da ja unter anderem Werte für den Achsenabschnitt geschätzt werden sollen. Bei diesem zu schätzenden Achsenabschnitt handelt es sich jedoch um die Konstante der Wachstumskurve, die als latente Variable bereits im Messmodell enthalten ist (Gl. (4.1)). Achsenabschnitt und Steigung der Wachstumskurve erklären gemeinsam mit den zufälligen Einflüssen (E in Gl. (4.1)) die Messwerte vollständig. Die Aufnahme einer zusätzlichen Konstante, die Stata ohne diese Option per Voreinstellung vornehmen würde, ist inhaltlich unbegründet und würde überdies dazu führen, dass das Modell nicht identifiziert wäre. Auch die Option means(I S) unterdrückt eine Voreinstellung, nämlich die, dass den latenten Variablen normalerweise ein Mittelwert von 0 zugewiesen wird, was hier offensichtlich nicht zielführend wäre.

Ausgabe 4 zeigt das Ergebnis der Modellschätzung. Die ersten fünf Felder spiegeln noch einmal die besondere Struktur des Modells mit ihren zahlreichen Restriktionen wider. Inhaltlich interessant ist aber primär das sechste Feld, das die geschätzten Mittelwerte der beiden latenten Variablen enthält. Das mittlere Interesse zu Beginn des Wahlkampfes lag danach bei 3.08 Punkten, also fast exakt am Mittelpunkt der Skala. Der mittlere Anstieg des Interesses pro Wahlkampftag ist mit 0.0008685 verschwindend gering. Auf die gesamte Dauer von 60 Tagen gerechnet stieg das wahre Interesse am Wahlkampf im Mittel um lediglich 0.052 Skalenpunkte.

Da es sich hier um latente Variablen handelt, werden Achsenabschnitt und Steigung als normalverteilt modelliert. Die entsprechenden Schätzwerte finden sich ganz unten im siebten Feld der Tabelle. Hier zeigt sich, dass die Streuung der Achsenabschnitte (Interesse zu Beginn des Wahlkampfes) recht groß ist. Die Varianz von 0.91 entspricht einer Standardabweichung von 0.95, d. h. das Interesse streut über den gesamten Wertebereich der Skala. Die geschätzte Varianz der Steigung ist naturgemäß sehr viel kleiner.

. use interesse-panel, clear

. sem (I -> int1@1 int2@1 int3@1 int4@1 int5@1) ///

> (S -> int1@0 int2@14 int3@28 int4@46 int5@60) ///

> , noconstant means(I S) (Ausgabe gekürzt)

mean(I)

3.080961

.0176298

174.76

0.000

3.046407

3.115515

mean(S)

.0008685

.000242

3.59

0.000

.0003942

.0013428

var(e.int1)

.3048736

.0116468

.28288

.3285773

var(e.int2)

.3009966

.0094827

.2829731

.3201681

var(e.int3)

.3579735

.0102917

.3383599

.3787239

var(e.int4)

.3126102

.0097413

.2940889

.3322979

var(e.int5)

.2772259

.0116425

.2553209

.3010102

var(I)

.9084802

.0261675

.8586138

.9612428

var(S)

.0000752

5.59e-06

.000065

.0000869

cov(I,S)

-.0017147

.0002796

-6.13

0.000

-.0022627

-.0011667

LR test of model vs. saturated: chi2(10) = 185.98, Prob > chi2 = 0.0000

Ausgabe 4: SEM-Modellierung der Zunahme des Interesses am Wahlkampf in

Stata

1 predict lat *, latent

2 graph twoway ///

3 ( function y= _b[ mean (I): _cons ] + x * _b[ mean ( S): _cons ], range (0 60) clpattern ( solid )) ///

4 ( function y= lat1 [1] + lat2 [1] *x, range (0 60) clpattern ( dash )) ///

5 ( function y= lat1 [2] + lat2 [2] *x, range (0 60) clpattern ( dash )) ///

6 ( function y= lat1 [3] + lat2 [3] *x, range (0 60) clpattern ( dash )), ///

7 legend ( off ) xlabel (, nogrid ) ylabel (, nogrid ) plotregion ( style ( none )) ytitle (" Interesse ") xtitle (" t")

Listing 4.5 Plot der latenten Wachstumskurven des Interesses am Wahlkampf in Stata

Aus dem Mittelwert und der Varianz der Steigung sowie der Annahme einer Normalverteilung der Werte über die Befragten ergibt sich, dass für rund zwei Drittel der Befragten der wahre Wert des Interesses im Laufe des Wahlkampfes (leicht) ansteigt, während er für das verbleibende Drittel (leicht) sinkt [3].

Am einfachsten lässt sich dies nachvollziehen, indem man vom Computer die geschätzten Werte der latenten Variablen errechnen lässt und diese abspeichert. Wie dies geht, zeigt die erste Zeile von Listing 4.5. predict ist ein Stata-Befehl, mit dessen Hilfe nach Schätzung eines Modells die erwarteten Werte und Residuen in neuen Variablen gespeichert werden können [4]. Die Option latent fordert erwartete Werte für die latenten Variablen an (Voreinstellung sind erwartete Werte für die beobachteten Variablen). Diese werden in den Variablen lat1 und lat2 gespeichert. Statt diese Namen auszuschreiben, wurde in Zeile 1 der Stamm des Variablennamens um das Jokerzeichen * ergänzt (lat*). Dies bewirkt, dass Stata die benötigte Anzahl von Variablen erzeugt und durchnummeriert. Bei komplexeren Modellen reduziert dies nicht nur den Aufwand für die Eingabe, sondern auch mögliche Fehlerquellen.

Mit Hilfe dieser gespeicherten Werte lassen sich eine Reihe inhaltlich interessanter Fragen beantworten. Beispielsweise kann man mit gen stark = lat2>=0.01 eine Dummy-Variable erzeugen, die solche Personen markiert, deren Interesse pro Tag um mindestens 0.01 Skalenpunkte zunimmt, und sich anschließend mit tab1 stark deren Anteil an der Stichprobe (4.27 %) anzeigen lassen.

Der Befehl reg lat1 i.bildung i.male zeigt, dass das initiale Interesse am Wahlkampf unabhängig von der formalen Bildung bei Männern 0.29 Punkte höher ist als bei Frauen. Die Differenz zwischen Befragten mit Hauptschulabschluss und solchen mit Abitur liegt (wiederum unabhängig vom Geschlecht) bei 0.24 Skalenpunkten. Im Mittel ist das Interesse männlicher Abiturienten mithin rund einen halben Skalenpunkt höher als das von Hauptschulabsolventinnen.

Dadurch, dass Steigung und Achsenabschnitt als latente Variablen eines Strukturgleichungsmodells konzeptualisiert werden, eröffnen sich über solche ex-postAnalysen hinaus weitreichende Möglichkeiten zur Modellierung. Beispielsweise könnten die Effekte der formalen Bildung und des Geschlechtes auf das Ausgangsniveau des politischen Interesses direkt in das Modell eingebaut werden. Ebenso wäre es möglich, etwa die Wahrscheinlichkeit der Wechselwahl auf die Geschwindigkeit, mit der das Interesse während des Wahlkampfes ansteigt, zu regredieren.

Die Befehle in den Zeilen 2 bis 7 stellen die durchschnittliche Zunahme des Interesses sowie drei individuelle Wachstumskurven graphisch dar. Zeile 2 legt dabei fest, dass es sich um eine Grafik mit zwei Achsen handelt, während Zeile 7 eine Reihe von Optionen enthält, die unerwünschte Elemente der Grafik unterdrücken und die Beschriftung der Achsen festlegen. Von inhaltlichem Interesse sind nur die Zeilen 3 bis 6. Das Schlüsselwort function legt fest, dass analog zu Abb. 4.2

Wachstumskurven gezeichnet werden sollen [5]. Die Anweisungen für jede Kurve sind in Klammern eingeschlossen und stehen jeweils in einer eigenen Zeile, um die Übersichtlichkeit zu erhöhen. Auf function folgt dann die Kurvenbzw. hier

Geradengleichung. Zeile 3 enthält die Anweisungen zur Darstellung der mittleren Wachstumskurve.

Um diese zu entschlüsseln, muss man sich in Erinnerung rufen, dass der Ausdruck _b[] auf die Parameterschätzungen eines Modells zugreift. So kann man mit den exakten Schätzwerten weiterrechnen, ohne dass diese kopiert oder abge-

tippt werden müssen. Bei komplexen Modellen muss als Argument für _b[] nicht nur der Name des gewünschten Koeffizienten, sondern auch der Modellbestandteil angegeben werden, in dem der Koeffizient auftaucht. Die Kombination von Modellbestandteil und Koeffizientennamen ist leider nicht immer offensichtlich. Abhilfe schafft hier die Option ,coeflegend. Der Befehl sem, coeflegend gibt noch einmal die Tabelle der Koeffizienten aus, ohne dass das Modell neu geschätzt

Ausgabe 5: Ausgabe der symbolischen Namen für die Parameterschätzungen in

Stata

werden muss, ergänzt diese aber um die symbolischen Ausdrücke, mit denen auf die Parameterschätzungen verwiesen werden kann (Ausgabe 5).

Mit diesem Wissen erschließt sich der Inhalt von Zeile 3: Der erwartete Wert des Interesses ist eine Funktion des Achsenabschnitts (_b[mean(I):_cons]) und des Produktes von Steigung (_b[mean(S):_cons]) und Zeit [6]. Letztere wird über die ganze Spannweite der beobachteten Fälle, also von 0 bis 60, variiert (,range(0 60)). Die zusätzliche Option (,clpattern(solid)) legt fest, dass die Funktion

mit einer durchgezogenen Linie geplottet wird.

In Zeile 4 wird die individuelle Wachstumskurve für den ersten Fall im Datensatz gezeichnet. Die Variablen lat1 und lat2 enthalten wie oben erläutert die individuellen Schätzungen für den Wert der beiden latenten Variablen. Mit der Syntax lat1[1] bzw. lat2[1] wird auf die Werte zurückgegriffen, die diese beiden Variablen für den ersten Fall annehmen. Mit ,clpattern(dash) wird das gestrichelte Muster für die Linie ausgewählt. Zeile 5 und 6 zeichnen analog dazu die Wachstumskurven für den zweiten und den dritten Fall. Abbildung 4.4 zeigt das Ergebnis des Befehls.

Abb. 4.4 Durchschnittliche und individuelle Wachstumskurven des Interesses am Wahlkampf

1 Data:

2 File is interesse panel . dat ;

3 Variable:

4 Names are

5 int1 int2 int3 int4 int5 tn1 tn2 tn3 tn4 tn5 ;

6 Missing are all ( -9999) ;

7 Usevariables are

8 int1 int2 int3 int4 int5 ;

9 Model: I S | int1@0 int2@14 int3@28 int4@46 int5@60

Listing 4.6 Wachstumsmodell des Wahlkampfinteresses in Mplus

Dasselbe Wachstumsmodell lässt sich auch in Mplus sehr einfach definieren. Wie Listing 4.6 zeigt, ist diese Spezifikation sogar noch etwas kompakter, weil Mplus eine besondere Syntax für Wachstumsmodelle kennt. In den Zeilen 1 bis 8 werden lediglich die Daten eingelesen, benannt und für die Analyse ausgewählt. Die eigentliche Modellspezifikation beschränkt sich auf Zeile 9. Das |-Zeichen signalisiert, dass ein Wachstumsmodell geschätzt werden soll. Links davon finden sich die bereits bekannten latenten Variablen I und S. Deren Namen können im

1 Raw Data From File interesse panel . lsf

2

3 Latent Variables: I S

4

5 Relationships

6

7 int1 = 1* I + 0 * S

8 int2 = 1* I + 14 * S

9 int3 = 1* I + 28 * S

10 int4 = 1* I + 46 * S

11 int5 = 1* I + 60 * S

12

13 I = Const

14 S = Const

15

16 End of Problem

Listing 4.7 Wachstumsmodell des Wahlkampfinteresses in SIMPLIS

Prinzip beliebig gewählt werden, aber ihre Reihenfolge ist wichtig: Ganz links steht der Achsenabschnitt, auf den dann die Steigung folgt. Auf der rechten Seite des |Zeichens sind dann die Messwerte platziert, deren zeitlicher Abstand wiederum bestimmt, auf welche Werte die Pfadkoeffizienten fixiert werden. Anders als in Stata ist es nicht notwendig, die Pfade zwischen Achsenabschnitt und Messwerten auf den Wert 1 zu fixieren. Dies geschieht in Mplus per Voreinstellung, weil die Spezifikation vom Programm als Wachstumsmodell erkannt wird.

Auch in LISREL bereitet die Spezifikation des Wachstumsmodell keine besonderen Probleme. Listing 4.6 zeigt den dafür benötigten SIMPLIS-Code. In Zeile 1 werden die Daten im LISREL-Format eingelesen; Zeile 3 definiert die latenten Variablen I und S, ab Zeile 5 folgt dann die Definition der Struktur des Modells mit den zehn mittlerweile vertrauten Pfaden und den zugehörigen Restriktionen, die wie in der Syntax für Stata alle explizit gemacht werden müssen. Die einzige Besonderheit findet sich in den Zeilen 13 und 14. Hier werden die latenten Variablen als konstant definiert, damit für sie ein Mittelwert geschätzt und ausgegeben wird. Dies entspricht der Option means(I S) in Zeile 4 der Stata-Eingabe (Listing 4.4). Per Voreinstellung verwenden alle drei Programme das ML-Verfahren. Die Parameterschätzungen stimmen deshalb bis auf mehrere Nachkommastellen überein.

Die minimalen Differenzen erklären sich wie in den anderen Beispielen aus den je unterschiedlichen Startwerten und Abbruchkriterien.

Der Vorteil des hier vorgestellten univariaten linearen Wachstumsmodells ist seine sehr einfache Struktur. Wenn dies aufgrund der Forschungsfrage und der theoretischen Grundannahme sinnvoll erscheint, kann es aber sehr leicht erweitert werden. So kann zusätzlich zum linearen Effekt der Zeit noch ein quadratischer Term in das Modell aufgenommen werden, indem eine weitere latente Variable spezifiziert wird, deren Pfadkoeffizienten analog zum Vorgehen auf die quadrierte Zahl der Tage seit Beginn der Studie fixiert werden. Auch multivariate Messungen des Interesses und die Ergänzung um Variablen, die Unterschiede in Ausgangsniveau und Anstieg des Interesses erklären können, sind denkbar. Gerade Mplus lässt die Spezifikation einer ganzen Reihe sehr flexibler Wachstumsmodelle zu [7]. Wichtig ist es dabei jedoch, die Forschungsfrage und auch das Problem der Identifikation im Blick zu behalten. Bereits für das einfache lineare Wachstumsmodell wird ein mindestens dreiwelliges Panel benötigt, um sicherzustellen, dass die Zahl der unabhängigen Informationen (Varianzen, Kovarianzen, Mittelwerte) mindestens so groß ist wie die Zahl der zu schätzenden Parameter. Für komplexere Modelle und stabile Schätzungen braucht man jedoch Paneldaten mit vier oder mehr Wellen, die wegen des großen administrativen Aufwands und der damit verbundenen Kosten nur selten erhoben werden.

  • [1] In komplizierteren Designs können alle drei Annahmen bzw. Voraussetzungen aufgegeben oder modifiziert werden
  • [2] Nicht alle Respondenten haben an allen fünf Befragungswellen teilgenommen. Außerdem setzten die Befragungen bereits früher ein und wurden auch nach der Bundestagswahl fortgesetzt. Um das Modell übersichtlich zu halten, beschränkt sich die Analyse hier aber auf jene Befragten, die sich an den fünf Wellen während des Wahlkampfes beteiligt und die Fragen nach ihrem Interesse am Wahlkampf beantwortet haben. Zudem wurde die Information zum Befragungszeitpunkt so umkodiert, dass allen Respondenten einer Welle exakt das gleiche Datum zugewiesen wurde, obwohl die reale Feldzeit pro Welle bei mehreren Tagen lag
  • [3] Dabei ist allerdings zu beachten, dass es sich hier nur um Schätzungen für den Wert der Steigung und dessen Varianz in der Population handelt, die ihrerseits mit einem nicht unerheblichen Stichprobenfehler behaftet sind, wie ein Blick auf die Konfidenzintervalle zeigt. Das Konfidenzintervall der Varianz ist asymmetrisch, weil Varianzen nicht negativ sein können
  • [4] Dies gilt grundsätzlich für alle e-class (estimation) Kommandos. Welche Werte im einzelnen gespeichert werden können, hängt vom jeweiligen Kommando ab
  • [5] Siehe dazu das den Band [G]raphics des Stata-Handbuches bzw. help graph twoway
  • [6] Statt der vertrauten Variable t repräsentiert hier x die Zeit. Dies ist den Beschränkungen der Stata-Syntax geschuldet: graph twoway function lässt als Namen für abhängige und unabhängige Variable nur y und x zu
  • [7] Das entsprechende Kap. 6 im Benutzerhandbuch umfasst mehr als fünfzig Druckseiten
 
Fehler gefunden? Bitte markieren Sie das Wort und drücken Sie die Umschalttaste + Eingabetaste  
< Zurück   INHALT   Weiter >
 
Fachgebiet
Betriebswirtschaft & Management
Erziehungswissenschaft & Sprachen
Geographie
Informatik
Kultur
Lebensmittelwissenschaft & Ernährung
Marketing
Maschinenbau
Medien und Kommunikationswissenschaft
Medizin
Ökonomik
Pädagogik
Philosophie
Politikwissenschaft
Psychologie
Rechtswissenschaft
Sozialwissenschaften
Statistik
Finanzen
Umweltwissenschaften