< Zurück   INHALT   Weiter >

4.1.2 Ein Beispiel: Politische Wirksamkeit (efficacy)

Abbildung 4.1 ordnet die oben vorgestellten Indikatoren der politischen Wirksamkeit den beiden dort angesprochenen Unterdimensionen zu. Statt der im Allbus verwendeten numerischen Variablennamen werden dabei hier und im folgenden Abkürzungen verwendet, die vom Wortlaut des betreffenden Items abgeleitet sind. Im Beispieldatensatz wurden die Antworten außerdem so umkodiert, dass hohe Werte einer hohen politischen Wirksamkeit entsprechen.

1 use allbus -08 efficacy , replace

2 gsem ( External -> pkuemmern vertreten , ologit ) ( Internal -> aktiv komplex wissen , ologit )

Listing 4.1 CFA mit kategorialen Indikatoren in Stata

Im Kern handelt es sich hier wieder um eine CFA (siehe Abschn. 3.2). Für die beiden latenten Variablen gilt dementsprechend, dass sie als stetig und normalverteilt betrachtet werden. Auch an den Annahmen über ihre Varianz, die getroffen werden müssen, um das Modell zu identifizieren, ändert sich nichts.

Listing 4.1 zeigt, wie sich das Modell beispielhaft in Stata schätzen lässt. Von den Eingaben in Kap. 3 unterscheidet es sich nur in zwei Punkten. Erstens wird nun der Stata-Befehl gsem aufgerufen. Das g steht hier für „generalised“ und deutet darauf hin, dass dieses Kommando im Gegensatz zu sem mit nicht-intervallskalierten Daten arbeitet [1]. Zweitens enthalten die Definitionen der Messmodelle nun die Option , ologit. Dies bedeutet, dass die Verbindung zwischen den latenten

Variablen und ihren Indikatoren als ordinal-logistischer Link modelliert werden soll.

Das Ergebnis findet sich in Ausgabe 3. Obwohl das Modell nur fünf Indikatoren enthält, dauert die Schätzung wegen des numerischen Aufwands deutlich, d. h. mindestens zweibis dreimal länger als bei einem vergleichbaren Modell für intervallskalierte Daten. Das Iterationsprotokoll ist deshalb sehr umfangreich und wurde hier aus Platzgründen entfernt.

Die eigentliche Ausgabe beginnt mit einem Hinweis auf den Typ des geschätzten Modells, der Fallzahl und dem finalen Wert der Log-Likelihood, sowie einer Übersicht über die identifizierenden Restriktionen. Analog zu sem wurde hier jeweils der Pfad zwischen den latenten Variablen und ihrem ersten Indikator auf den Wert von 1 gesetzt. Selbstverständlich könnten hier auch andere Pfade ausgewählt werden.

Im oberen Teil der Ausgabetabelle folgen dann die Schätzungen für die Koeffizienten. Diese beschreiben, wie sich eine Veränderung der latenten Variablen auf der logistischen Skala (d. h. auf der Ebene der Antworttendenz) auswirkt. Zu interpretieren sind hier in erster Linie die Richtung und die statistische Signifikanz der Koeffizienten. Letztere ist bei allen Items gegeben, und die Richtung entspricht den theoretischen Erwartungen.

Ausgabe 3: CFA der politischen Wirksamkeit (efficacy) in Stata

Grundsätzlich sollten logistische Modelle wenn möglich auf der Ebene der erwarteten Wahrscheinlichkeiten interpretiert werden, da Logit-Koeffizienten oder auch Odds (Verhältnisse von Wahrscheinlichkeiten) wenig anschaulich sind (King et al. 2000). Bei ordinalen Modellen ist allerdings für jede Antwortkategorie eine eigene Wahrscheinlichkeit zu berechnen, was die Darstellung unübersichtlich machen kann. Zudem ist der Zusammenhang zwischen Antworttendenz und Antwortwahrscheinlichkeit für die mittleren Kategorien nicht monoton. Vielmehr steigt hier die Wahrscheinlichkeit mit steigender Tendenz an, um dann zugunsten der extremeren Kategorien wieder abzusinken. Einfacher und in der Regel auch sinnvoller ist es auszurechnen, mit welcher Wahrscheinlichkeit maximal eine bestimmte Antwortkategorie erreicht wird (Long und Freese 2006, Kap. 5). Im Beispiel könnte

1 Raw Data From File allbus -08 efficacy . lsf

2 $ADAPQ (8) LOGIT

3

4 Latent Variables: Internal External

5 Relationships

6 pkuemmer = 1* External

7 vertrete = External

8 aktiv = 1* Internal

9 komplex = Internal

10 wissen = Internal

11

12 End of Problem

Listing 4.2 CFA mit kategorialen Daten in SIMPLIS

man etwa fragen, wie wahrscheinlich eine zustimmende Antwort (Antwortvorgaben 3 und 4) im Gegensatz zu einer ablehnenden Antwort (Antwortvorgaben 1 und 2) ist.

In jedem Fall werden dafür die oben angesprochenen Schwellenwerte benötigt, die in Stata als „cutpoints“ bezeichnet werden. Da für jedes der fünf Items drei solcher cutpoints geschätzt werden, wurde auch hier auf den Abdruck der Ausgabe verzichtet.

Interessanter als die Details des Messmodells ist hier jedoch der Zusammenhang zwischen interner und externer efficacy. Die Kovarianz der beiden latenten Variablen beträgt 0.52. Um daraus eine Korrelation (Abschn. 2.2.2) zu errechnen, werden die Standardabweichungen (die Quadratwurzeln der Faktorvarianzen) benötigt. Setzt man diese in Gl. (2.21), Seite 27 ein, so ergibt sich ein Wert von 0.214. Zwischen der Einschätzung der eigenen politischen Kompetenz (internal efficacy) und der wahrgenommenen Responsivität des politischen Systems (external efficacy) besteht also selbst dann, wenn der Einfluss von Messfehlern berücksichtigt wird, nur ein recht schwacher positiver Zusammenhang. Dies entspricht dem internationalen Forschungsstand.

Wie oben dargelegt lässt sich ein solches ordinal-logistisches Modell auch in neueren Versionen von LISREL realisieren. Listing 4.2 zeigt die dafür notwendigen Anweisungen. Voraussetzung ist zunächst, dass die Rohdaten zur Verfügung stehen. Diese werden in Zeile 1 eingelesen. Entscheidend für das Weitere ist Zeile 2. Diese bewirkt, dass die Zusammenhänge zwischen latenten Variablen und Indikatoren mit einem logistischen Link modelliert werden. Dabei kommt (wie in den anderen Programmen auch) ein numerisches Integrationsverfahren zur Approximation der Likelihood-Funktion zum Einsatz. ADAPQ(8) bedeutet, dass diese adaptive Quadratur mit acht Integrationspunkten durchgeführt werden soll.

1 Data:

2 File is allbus -08 efficacy . dat ;

3 Variable:

4 Names are pkuemmern aktiv komplex vertreten wissen ;

5 Categorical are pkuemmern aktiv komplex vertreten wissen ;

6 Missing are all ( -9999) ;

7 Analysis:

8 Estimator = ML ;

9 Process = 4 ;

10 Model:

11 external by pkuemmern vertreten ;

12 internal by aktiv komplex wissen ;

Listing 4.3 CFA mit kategorialen Daten in Mplus

Je höher die Zahl der Punkte, desto besser die Approximation, desto höher aber auch der numerische Aufwand. Acht bis zwölf Integrationspunkte reichen in der Praxis aus; bei sehr komplexen Modellen muss die Zahl zumindest in der Phase der Modellentwicklung nach unten korrigiert werden, weil die Modellschätzung sonst prohibitiv lange dauern kann.

Zeile 4 definiert die latenten Variablen, ab Zeile 6 folgen dann die Gleichungen des Messmodells. Zu beachten ist hier lediglich, dass der Wert des Pfades zwischen Faktor und erstem Indikator fixiert wird, um die Metrik der Faktoren festzulegen. Ansonsten würde qua Voreinstellung die alternative Parametrisierung gewählt, die beiden Faktoren eine Varianz von 1 zuordnet. Die Ergebnisse sind selbstverständlich mit denen von Stata identisch [2].

Lässt man Zeile 2 weg, so schätzt LISREL das Modell auf Basis der oben erläuterten polybzw. tetrachorischen Korrelationen, sofern die Variablen nicht in PRELIS als intervallskaliert definiert wurden. Im Ergebnis unterscheiden sich alle drei Varianten der Modellierung jedoch kaum.

Listing 4.3 schließlich enthält die Befehle die benötigt werden, um das Modell in Mplus zu schätzen. Wichtig ist hier vor allem Zeile 5, die festlegt, welche Variablen als kategorial betrachtet werden sollen. Zeile 8 wählt das zu verwendende Schätzverfahren (hier ML) aus. Dies impliziert zugleich, dass die Beziehungen zwischen Faktoren und kategorialen Indikatoren als logistisch definiert werden. Ohne diese Anwendung würde der WLSMV-Schätzer (eine Mplus-spezifische Variante von WLS/ADF) gewählt. Dieser ist numerisch deutlich weniger aufwendig, impliziert allerdings einen Probit-Link zwischen Faktoren und Indikatoren [3]. Mit der Entscheidung für ein Schätzverfahren ist also an dieser Stelle zugleich eine Entscheidung über ein Detail der Modellspezifikation verbunden. Zeile 9 schließlich weist das Programm an, eine bestimmte Zahl (hier: vier) von Prozessoren bzw. Prozessorkernen zu nutzen, was auf entsprechend ausgestatteten Computern die Schätzung erheblich beschleunigen kann.

Ein großer Vorteil von Mplus liegt darin, dass unabhängig vom Lizenztyp die maximal vorhandene Zahl von Prozessorkernen genutzt werden kann. Allerdings muss dies vom Benutzer vorgegeben werden. Bei Stata hingegen hängt der Preis der Lizenz von der Zahl der damit maximal nutzbaren Kerne ab. Sofern der Benutzer keine anderen Anweisungen gibt, wird dann aber stets die maximal mögliche Zahl von Prozessorkernen verwendet.

  • [1] Die Syntax von gsem ist der von sem sehr ähnlich. Über die Unterschiede im Detail informiert das Handbuch bzw. help gsem
  • [2] Kleinere Abweichungen ergeben sich z. B. aus Unterschieden bei der voreingestellten Zahl von Integrationspunkten sowie unterschiedlichen Integrationsverfahren
  • [3] Inhaltlich macht dies in der Regel keinen Unterschied; das logistische Modell wird aber in der Politikwissenschaft etwas häufiger angewendet. Für einen detaillierten Vergleich von multinomialen Logitund Probit-Modellen siehe Dow und Endersby 2004; Kropko 2010
 
< Zurück   INHALT   Weiter >