Menü
Start
Anmelden / Registrieren
Suche
 
Start arrow Politikwissenschaft arrow Strukturgleichungsmodelle
< Zurück   INHALT   Weiter >

3.3 Gruppenvergleich und äquivalente Messungen

Bei der Schätzung von Strukturgleichungsmodellen stellt sich häufig die Frage, ob sich Stärke und Richtung der gefundenen Zusammenhänge in verschiedenen Gruppen (z. B. Männer und Frauen) voneinander unterscheiden. Von besonderem Interesse ist diese Frage dann, wenn es sich bei diesen Gruppen um kulturelle Kontexte handelt: Große internationale Vergleichsstudien wie der World Values Survey oder der European Social Survey basieren auf einem englischsprachigen Ausgangsfragebogen, der in die Muttersprache der Befragten übersetzt wird.

Ob diese Übersetzungsleistung für alle Sprachen und Kulturen in gleicher Weise funktioniert, ist dabei eine durchaus offene Frage, die sich aus Perspektive der Modellierung von Strukturgleichungen sehr differenziert beantworten lässt. Ein Beispiel dafür ist Davidovs (2009) Analyse von nationalistischen und patriotischen Einstellungen in 34 Nationen auf Grundlage der Daten des International Social Survey Programme (ISSP).

Abb. 3.2 Davidovs (2009) zweidimensionales Modell nationalistischer/patriotischer Einstellungen

Davidov unterscheidet dabei in Anlehnung an Blank und Schmidt (2003) zwischen Nationalismus auf der einen und „konstruktivem Patriotismus“ auf der anderen Seite. Das von ihm vorgeschlagene Messmodell verfügt über 2 + 3 Indikatoren, ist aber ansonsten strukturell mit dem in Abschn. 3.2 vorgestellten Modell der Ausländerfeindlichkeit identisch (vgl. Abb. 3.2). Bei der Schätzung des Modells differenziert Davidov (2009, S. 68–69) unter Rekurs auf die weiterführende Literatur [1] zwischen drei unterschiedlich strikten Definitionen von Invarianz über kulturelle Kontexte:

1. Configural Invariance Diese erfordert lediglich, dass die Grundstruktur des Modells in allen Ländern die gleiche ist. Konkret wird gefordert, dass alle Items in allen Kontexten auf dieselben Faktoren laden, dass diese Ladungen das korrekte Vorzeichen haben, statistisch signifikant und inhaltlich relevant sind, und dass die Korrelationen/Kovarianzen zwischen den Faktoren kleiner 1 sind, so dass diese voneinander unterscheidbar bleiben.

2. Metric Invariance Für das Vorliegen von metrischer Invarianz müssen darüber hinaus auch die Faktorladungen identisch sein. Eine Zunahme von „Patriotismus“ um eine Einheit hätte dann in allen Kontexten eine Zunahme des erwarteten Wertes für „Pride in democracy ...“ um den gleichen Betrag zur Folge. Dennoch können sich die Mittelwerte eines Items zwischen den Ländern unterscheiden, da die Achsenabschnitte nicht identisch sein müssen.

3. Scalar Invariance Skalare Invarianz hingegen erfordert zusätzlich genau dies. Wenn sowohl die Faktorladungen als auch die Achsenabschnitte identisch sind, bedeutet dies, dass die absoluten Werte der Indikatoren miteinander vergleichbar sind. Noch interessanter ist der Umkehrschluß, der sich daraus ergibt: Trifft die Annahme der skalaren Invarianz zu, dann können die aus den beobachteten Indikatoren errechneten Werte der Faktoren über kulturelle Kontexte miteinander verglichen werden. Auf diese Weise ist es dann beispielsweise möglich zu ermitteln, in welchem Land die Befragten im Mittel nationalistischer eingestellt sind. Dies lässt immer noch die Möglichkeit zu, dass sich (je nach gewählter Parametrisierung) die Fehlervarianzen der Items bzw. die Varianzen der Faktoren voneinander unterscheiden.

In der Terminologie der Modellierung von Strukturgleichungen wird die Vorgehensweise Davidovs als KONFIRMATORISCHE MEHR-GRUPPEN-FAKTORENANALYSE (MGCFA) bezeichnet. Insbesondere in der international vergleichenden Einstellungsforschung als zusehends wichtigerem Teilgebiet der Vergleichenden Politikwissenschaft ist dieses Verfahren von großer und weiter wachsender Bedeutung.

Bei ihrer Anwendung zeigt sich häufig, dass Messinstrumente nicht oder zumindest nicht vollständig invariant sind. Die Diskussion der letzten Jahre hat jedoch deutlich gemacht, dass vergleichende Aussagen unter bestimmten Umständen dennoch möglich sind. Meulemann (2012) und Oberski (2014) entwickeln Formeln und Programmcode, mit deren Hilfe sich die inhaltlichen Konsequenzen fehlender Äquivalenz abschätzen lassen. Davidov et al. (2014) schlagen konkrete Strategien vor, um wenigstens Teile eines Forschungsprojekts zu retten, und geben einen Überblick über die neuesten, teilweise noch sehr experimentellen Entwicklungen in diesem Bereich.

Die von Davidov et al. (2014) vorgestellten Ansätze gehen über das hinaus, was im Rahmen dieser Einführung vermittelt werden kann. Die Grundzüge der MGCFA sind aber leicht nachzuvollziehen und lassen sich sowohl in Stata als auch in LISREL und Mplus sehr einfach implementieren. Wichtig ist dabei zu beachten, dass die drei Programme unterschiedliche Voreinstellungen für Restriktionen der Parameter verwenden.

Listing 3.4 zeigt, wie sich eine MGCFA in Stata realisieren lässt. Das zweidimensionale Modell der Einstellungen zu Migranten aus Abschn. 3.2 wird nun getrennt für zwei Gruppen – Ostund Westdeutsche – geschätzt. Hintergrund ist hier zunächst die Frage, ob die verwendeten Instrumente trotz der weiterhin bestehenden Unterschiede in der politischen Kultur in beiden Regionen in äquivalenter Weise funktionieren. Sollte dies der Fall sein, lässt sich dann in einem zweiten Schritt überprüfen, ob und wie sich die Einstellungen von Ostund Westdeutschen unterscheiden.

1 * Datensatz laden

2 use ess w1 mgcfa , replace

3

4 * Configural invariance

5 sem ( OEK -> imtcjob imbleco ) ( CULT -> imueclt imwbcnt ) , group ( ost ) ginvariant ( none ) means ( OEK@0 CULT@0 )

6 est store configural

7

8 * Metric Invariance

9 sem ( OEK -> imtcjob imbleco ) ( CULT -> imueclt imwbcnt ) , group ( ost ) ginvariant ( mcoef ) means ( OEK@0 CULT@0 )

10 est store metric

11

12 * Scalar Invariance

13 sem ( OEK -> imtcjob imbleco ) ( CULT -> imueclt imwbcnt ) , group ( ost ) ginvariant ( mcoef mcons )

14 est store scalar

15

16 * LR Test scalar vs metric

17 lrtest configural metric , stat

18 * LR Test metric vs configural

19 lrtest metric scalar , stat

20 * LM -/ WTest fuer scalar

21 est restore scalar

22 estat ginvariant

23 est stat *

24 estat gof , stats ( all )

Listing 3.4 MGCFA in Stata

In Zeile 5 wird das Modell unter der Annahme konfiguraler Invarianz geschätzt. Gegenüber Listing 3.1 wurde eine kompaktere Form der Darstellung gewählt, die jeden Faktor mit allen seinen Indikatoren zusammenfasst. Ansonsten sind zwei Optionen neu: group(ost) legt fest, dass die Gruppen durch die Ausprägungen der Variable ost (1 = neue Länder, 0 = alte Länder) definiert werden. Mit Hilfe von ginvariant(none) werden voreingestellte Restriktionen aufgehoben, so dass alle Pfade frei über die Gruppen variieren können. Ohne weiteres Zutun würde Stata das Modell unter der Annahme skalarer Invarianz schätzen.

Weitere Besonderheiten ergeben sich implizit aus dem Gruppenvergleich. Erstens ist es in diesem Kontext üblich, die Varianz der latenten Variablen durch die Anbindung an einen Indikator zu definieren (vgl. Abschn. 2.6.3, Seite 61), statt sie wie im letzten Beispiel auf den Wert von 1 festzusetzen. Dies geschieht, indem die Pfade zwischen den Faktoren und dem jeweils ersten Indikator auf den Wert 1 gesetzt werden. Inhaltlich bedeutet dies, dass sich in Abhängigkeit von dieser

Leitvariablen die Varianz der latenten Variablen zwischen beiden Regionen unterscheiden kann. Da diese Parametrisierung der Voreinstellung in Stata entspricht, sind keine besonderen Optionen erforderlich.

Zweitens stellt sich beim Gruppenvergleich ein spezifisches Identifikationsproblem im Bereich der Mittelwerte (Brown 2006, S. 258). Standardmäßig würde Stata für jeden Faktor pro Gruppe jeweils einen eigenen Mittelwert schätzen. Im Beispiel gibt es acht unabhängige Informationen über das Niveau der Variablen (die Mittelwerte der vier Items in den zwei Regionen), aus denen ohne weitere Restriktionen zwölf Parameter geschätzt werden müssten, die sich auf dieses Niveau beziehen: acht Achsenabschnitte einerseits und vier Mittelwerte der Faktoren andererseits. Das Modell wäre somit in diesem Bereich nicht identifiziert. Deshalb müssen die Gruppenmittelwerte mit der Option means() auf den Wert 0 gesetzt werden (über alternative Identifikationsstrategien informieren Brown 2006; Little und Slegers 2005).

In Listing 3.1 wurde diese Option zur Verdeutlichung verwendet, war aber entbehrlich, da sie im Ein-Gruppen-Fall der Voreinstellung entspricht. Hier ist sie essentiell, weil die Schätzung sonst nicht konvergiert und keine Fehlermeldung ausgegeben wird, die das Problem erklärt.

Die Modellschätzungen selbst entsprechen exakt den Resultaten, die man erhalten würde, wenn das Modell für beide Regionen separat geschätzt würde (bysort ost: sem . . . ). Mit der hier gewählten Syntax erreicht man jedoch eine simultane Schätzung mit einer gemeinsamen Log-Likelihood, so dass im nächsten Schritt ein Vergleich mit restriktiveren Spezifikationen möglich ist. Außerdem ist die Ausgabe kompakter, was einen Vergleich der Werte über die Gruppen hinweg erleichtert. Zeile 6 speichert Parameter, Anpassungsmaße und weitere Informationen unter einem aussagekräftigen Namen ab.

Zu beachten ist hier, dass es sich um ein fast gesättigtes Modell handelt. Da die Mittelwerte, Varianzen und Kovarianzen der p = 4 Variablen getrennt für die zwei Regionen berechnet werden, stehen insgesamt 2 × (2 × p + p×(p−1) ) = 28 Freiheitsgrade zur Verfügung. Geschätzt werden 26 Parameter: für jeder Region zwei Pfadkoeffizienten, vier Achsenabschnitte, sechs (Fehler-)Varianzen und eine Kovarianz zwischen den Faktoren. Somit bleiben nur zwei Freiheitsgrade übrig, um die Modellanpassung beurteilen zu können.

Metrische Invarianz bedeutet wie oben dargelegt, dass gemeinsame Pfadkoeffizienten für beide Regionen geschätzt werden. In Stata wird dies durch die Option ginvariant(mcoef) (Merkhilfe: Messmodell-Koeffizienten über die Gruppen invariant) in Zeile 9 erreicht. Durch diese zusätzliche Restriktion reduziert sich die

. lrtest configural metric ,stat

Likelihood-ratio test LR chi2(2) = 0.00

(Assumption: metric nested in configural) Prob > chi2 = 0.9991 Akaike´s information criterion and Bayesian information criterion

Model

Obs

ll(null)

ll(model)

df

AIC

BIC

metric

2662

.

-21459.48

24

42966.95

43108.24

configural

2662

.

-21459.48

26

42970.95

43124.01

Note: N=Obs used in calculating BIC; see [R] BIC note

Ausgabe 1: LR-Test für Mehr-Gruppen-CFA in Stata

Zahl der Parameter um zwei: Statt zwei mal zwei regionalen Faktorladungen werden nun zwei gemeinsame Koeffizienten geschätzt. Die eingesparten Freiheitsgrade können benutzt werden, um die Güte der Modellanpassung zu testen.

Zeile 13 in Listing 3.4 zeigt schließlich, wie die Annahme der skalaren Invarianz in Stata implementiert wird. Durch die zusätzliche Angabe mcons in der ginvariant-Option werden nur vier statt bisher acht Achsenabschnitte geschätzt. Dadurch ist es möglich, für jeden der beiden Faktoren die Differenz zwischen ostund westdeutschem Mittelwert zu schätzen und zugleich die Zahl der Freiheitsgrade noch einmal um zwei zu reduzieren. Alternativ könnte die Option auch ganz weggelassen werden, da dies wiederum den Voreinstellungen entspricht.

Welche der drei Varianten ist nun die beste? In der Forschung herrscht erstaunlich wenig Einigkeit darüber, nach welchen Kriterien man darüber urteilen sollte, ob die Bedingungen für eine bestimmte Form der Invarianz erfüllt sind. Grundsätzlich lassen sich zwei Strategien unterscheiden, die idealerweise zum selben Ergebnis führen sollten: die Modellvarianten können entweder mit Blick auf ihren gesamten Fit oder mit Hilfe direkter Tests verglichen werden, die sich das nesting der Modellvarianten zunutze machen (Letzteres wir im folgenden Beispiel demonstriert). Dabei können unterschiedliche Tests bzw. Fit-Indizes zum Einsatz kommen, und auch Kombinationen sind möglich (Davidov et al. 2014, S. 64–65).

Ausgabe 1 zeigt das Ergebnis eines LR-Tests für die Schätzungen unter der Annahme konfiguraler bzw. metrischer Invarianz, der in Zeile 17 angefordert wird. Voraussetzung für die Anwendung des LR-Tests ist, wie oben auf Seite 65 und Seite 68 dargelegt, erstens die Anwendung des ML-Verfahrens und zweitens eine Verschachtelung der beiden zu testenden Modelle. Beides ist hier gegeben. Das Modell der metrischen Invarianz (M2) ist ein Spezialfall des Modells der konfiguralen Invarianz (M1), von dem es sich durch die beiden zusätzlichen Restriktionen

. lrtest metric scalar,stat

Likelihood-ratio test LR chi2(2) = 3.86

(Assumption: scalar nested in metric) Prob > chi2 = 0.1449

Akaike´s information criterion and Bayesian information criterion

Model

Obs

ll(null)

ll(model)

df

AIC

BIC

scalar

2662

.

-21461.41

22

42966.82

43096.33

metric

2662

.

-21459.48

24

42966.95

43108.24

Note: N=Obs used in calculating BIC; see [R] BIC note

Ausgabe 2: Ein weiterer LR-Test für Mehr-Gruppen-CFA in Stata

(Faktorladungen für imbleco und imwbcnt in beiden Regionen identisch) unterscheidet [2].

Die fünfte Spalte der Tabelle enthält die Zahl der verbrauchten Freiheitsgrade (Parameter), während die vierte Spalte die Log-Likelihood Werte für die beiden konkurrierenden Modelle zeigt. Diese sind wie üblich logarithmiert, da es sich um winzig kleine Beträge handelt.

Die doppelte Differenz der Log-Likelihoods ist oben rechts noch einmal gesondert ausgewiesen. Sie entspricht der Differenz in den χ 2-Werten, die wiederum einer χ 2-Verteilung mit zwei Freiheitsgraden (der Differenz zwischen beiden Modellen) folgt.

Der Wert ist hier extrem klein (< 0.005, so dass sich gerundet 0.00 ergibt) und somit nicht signifikant von 0 verschieden. Die Wahrscheinlichkeit, dass die geringfügigen Unterschiede zwischen beiden Spezifikationen ausschließlich auf Stichprobenfehler zurückgehen, liegt bei über 99 %.

Parallel dazu zeigt Ausgabe 2 das Ergebnis eines LR-Tests für die Schätzungen unter Annahme metrischer und skalarer Invarianz (Zeile 19 in Listing 3.4). In diesem Fall ist die Differenz zwischen den χ 2-Werten bzw. den Log-Likelihoods etwas größer. Bei einer Irrtumswahrscheinlichkeit von fast 15 % ist dieser Unterschied nach konventionellen Maßstäben jedoch ebenfalls nicht signifikant.

Möchte man die Differenzen zwischen den Modellspezifikationen stattdessen

mit Hilfe eines Wald-Tests untersuchen, so ist dies mit dem generischen StataBefehl test möglich. Bequemer lässt sich dies jedoch mit dem Befehl estat ginvariant erreichen (Zeile 22), der nach einer MGCFA automatisierte Waldund Lagrange-Multiplier-Tests durchführen kann.

Zuvor sollten allerdings die Schätzungen für die restriktivste Spezifikation (skalare Invarianz) wieder in den Speicher zurückgerufen werden (Zeile 21). Die Tests zeigen dann für jeden Pfad, ob sich durch die Aufgabe von Restriktionen eine signifikante Verbesserung ergeben würde bzw. ob weitere Restriktionen ohne signifikante Verschlechterungen des Fits in das Modell aufgenommen werden können. Welche Gruppen von Koeffizienten im einzelnen getestet werden sollen, lässt sich über zusätzliche Optionen steuern.

Ganz rechts in Ausgabe 2 sind die beiden Informationsmaße AIC und BIC ausgewiesen. Beide signalisieren, dass trotz des geringfügig schlechteren Fits (niedrigere Log-Likelihoods) der restriktivsten Spezifikation der Vorzug gegeben soll („bessere“ Spezifikationen weisen niedrigere Werte auf). Beim BIC fällt diese Empfehlung etwas deutlicher aus, weil dieses, wie oben erwähnt, der Sparsamkeit der Modellierung größere Bedeutung zumisst.

Die Informationsmaße werden bei der Modellschätzung errechnet und gespeichert und lassen sich deshalb abrufen, ohne dass dafür ein LR-Test angefordert werden muss. Der Befehl in Zeile 23 erzeugt am Bildschirm eine Tabelle, die für

alle gespeicherten Modellspezifikationen (symbolisiert durch das Jokerzeichen *) die entsprechenden Kennwerte enthält.

Zeile 24 fordert die Berechnung aller (, stats(all)) in Stata implementierten Anpassungsmaße für die Spezifikation unter Annahme skalarer Invarianz an (letztere Schätzungen sind noch im Speicher, da kein neues Modell berechnet und kein anderes Set von Ergebnissen aktiviert wurde). Der RMSEA von 0.038 zeigt, dass sich so ein sehr guter Fit erreichen lässt.

Nachdem nun skalare Invarianz demonstriert wurde, lassen sich die Mittelwerteunterschiede zwischen Ost und West interpretieren. Insgesamt stehen die Ostdeutschen Migranten signifikant negativer gegenüber als die Westdeutschen. Der Unterschied beträgt bei den ökonomischen Bedrohungsgefühlen 0.7 und bei den kulturellen Bedrohungsgefühlen 0.4 Punkte. Dies entspricht in etwa einer halben bzw. einer viertel Standardabweichung.

Listing 3.5 zeigt, wie sich die Annahme der konfiguralen Invarianz in SIMPLIS überprüfen lässt. Von Listing 3.2 unterscheidet sich die Eingabe vor allem dadurch, dass nun zwei Gruppen von Befragten definiert werden (Zeile 1 bzw. Zeile 10). Die Namen beider Gruppen sind dabei frei wählbar, wichtig ist aber, dass die Rohdaten für beide Gruppen getrennt zur Verfügung gestellt werden (Zeile 2 und Zeile 11).

Die Definition des Modells (Zeile 3–8) ist fast vollständig mit den Anweisungen in den Zeilen 2–7 von Listing 3.2 identisch. Analog zum Vorgehen in Stata werden jetzt aber auch hier imtcjob und imueclt als Leitvariablen für die beiden latenten

Variablen gesetzt, um deren Metrik zu festzulegen.

1 Group West

2 Raw Data From File ess w1 mgcfa west . lsf

3 Latent Variables: OEK CULT

4 Relationships

5 imtcjob = CONSTANT + 1* OEK

6 imbleco = CONSTANT + OEK

7 imueclt = CONSTANT + 1* CULT

8 imwbcnt = CONSTANT + CULT

9

10 Group Ost

11 Raw Data From File ess w1 mgcfa ost . lsf

12 Relationships

13 imtcjob = CONSTANT + 1* OEK

14 imbleco = CONSTANT + OEK

15 imueclt = CONSTANT + 1* CULT

16 imwbcnt = CONSTANT + CULT

17

18 Set the Error Variances of imtcjob imwbcnt free

19 Set the Variances of OEK CULT free

20 Set the Covariance between OEK and CULT free

21

22 End of Problem

Listing 3.5 MGCFA in SIMPLIS (konfigurale Invarianz)

Die Syntax, mit deren Hilfe festgelegt wird, welche Parameter über die Gruppen hinweg variieren können, ist weniger kompakt, dafür aber klarer als in Stata: Grundsätzlich muss jede Gleichung, deren Parameterschätzungen von denen der ersten Gruppe abweichen können, in der betreffenden Gruppe noch einmal wiederholt werden [3]. Dies gilt auch für die impliziten Definitionen von Fehlervarianzen sowie Varianzen und Kovarianzen der latenten Variablen. Deshalb sind die Anweisungen in den Zeilen 18–20 notwendig, um für beide Gruppen separate Werte zu schätzen. Das Symbol – ist hier ähnlich wie in Stata nicht als Minuszeichen zu verstehen, sondern ermöglicht es, in kompakter Form auf den ganzen Bereich der oben definierten Variablen zu verweisen. Die Mittelwerte der Faktoren setzt LISREL hingegen ohne weiteres Zutun in beiden Gruppen auf den Wert von 0.

Aus dieser Logik ergibt sich auch, wie die Annahme der metrischen Invarianz in SIMPLIS bzw. LISREL formuliert wird: Aus den Gleichungen in Zeile 13–16

1 Group West

2 Raw Data From File ess w1 mgcfa west . lsf

3 Latent Variables: OEK CULT

4 Relationships

5 imtcjob = CONSTANT + 1* OEK

6 imbleco = CONSTANT + OEK

7 imueclt = CONSTANT + 1* CULT

8 imwbcnt = CONSTANT + CULT

9

10 Group Ost

11 Raw Data From File ess w1 mgcfa ost . lsf

12 Relationships

13 imtcjob = CONSTANT

14 imbleco = CONSTANT

15 imueclt = CONSTANT

16 imwbcnt = CONSTANT

17

18 Set the Error Variances of imtcjob imwbcnt free

19 Set the Variances of OEK CULT free

20 Set the Covariance between OEK and CULT free

21

22 End of Problem

Listing 3.6 MGCFA in SIMPLIS (metrische Invarianz)

müssen die Pfadkoeffizienten entfernt werden (vgl. Listing 3.6). Dies ist insofern verwirrend, als es sich nun optisch nicht mehr um Gleichungen handelt bzw. für den Wert der Indikatoren in der Gruppe „Ost“ scheinbar eine Konstante geschätzt wird. Tatsächlich bedeutet das Weglassen der Pfadkoeffizienten in der Syntax jedoch, dass für beide Gruppen ein gemeinsames Set von Parametern geschätzt werden soll.

Listing 3.7 schließlich zeigt, wie sich die Annahme skalarer Invarianz in SIMPLIS formulieren lässt. Zum einen entfallen die Zeilen 13–16 aus Listing 3.6, da nun für beide Gruppen gemeinsame Achsenabschnitte geschätzt werden. Zum anderen müssen die Mittelwertdifferenzen zwischen den Faktorwerten in den beiden Gruppen modelliert werden. Zu diesem Zweck werden in der ersten Gruppe (Westdeutsche) Faktormittelwerte definiert, aber auf 0 gesetzt (Zeile 9 und 10). Bei den Ostdeutschen hingegen werden die Mittelwerte der Faktoren (parametrisiert als Abweichungen von Westdeutschland) frei geschätzt.

In Mplus ist die Syntax für die Mehr-Gruppen-Analyse grundsätzlich derjenigen von SIMPLIS sehr ähnlich. Auch hier müssen Anweisungen für die zweite Gruppe wiederholt werden, wenn für diese separate Parameter zu schätzen sind. Zuvor muss jedoch zunächst einmal festgelegt werden, dass es sich überhaupt um

1 Group West

2 Raw Data From File ess w1 mgcfa west . lsf

3 Latent Variables: OEK CULT

4 Relationships

5 imtcjob = CONSTANT + 1* OEK

6 imbleco = CONSTANT + OEK

7 imueclt = CONSTANT + 1* CULT

8 imwbcnt = CONSTANT + CULT

9 OEK = 0* CONSTANT

10 CULT = 0* CONSTANT

11

12 Group Ost

13 Raw Data From File ess w1 mgcfa ost . lsf

14 OEK = CONSTANT

15 CULT = CONSTANT

16

17 Set the Error Variances of imtcjob imwbcnt free

18 Set the Variances of OEK CULT free

19 Set the Covariance between OEK and CULT free

20

21

22 End of Problem

Listing 3.7 MGCFA in SIMPLIS (skalare Invarianz)

1 Data:

2 File is ess w1 mgcfa raw . dat ;

3 Variable:

4 Names are

5 imtcjob imbleco imueclt imwbcnt ost ;

6 Grouping is ost (0 = west 1 = ost ) ;

7 Model:

8 OEK BY imtcjob imbleco ;

9 CULT BY imueclt imwbcnt ;

10

11 Model ost :

12 OEK BY imbleco ;

13 CULT BY imwbcnt ;

14 [ imtcjob imwbcnt ] ;

15 [ OEK CULT@0 ] ;

Listing 3.8 MCFA in Mplus (konfigurale Invarianz)

eine MGCFA handelt. Dies geschieht mit der Anweisung in Zeile 6 von Listing 3.8, die ost als Gruppierungsvariable definiert. Analog zu Stata und anders als bei LISREL/SIMPLIS ist es deshalb nicht notwendig, getrennte Datensätze bzw. Matrizen einzulesen.

In Zeilen 7–10 wird das Modell definiert. Die Kommandos sind weitgehend mit denen in Zeilen 7–11 von Listing 3.3 auf Seite 83 identisch; allerdings wird die Metrik der Faktoren nun auch hier über die Leitvariablen imtcjob und imueclt festgelegt.

Zeile 11–15 enthalten dann die für die Annahme konfiguraler Invarianz erforderlichen Anweisungen. Diese ergeben sich daraus, dass Mplus als Voreinstellung ein Modell unter Annahme skalarer Invarianz schätzen würde. Model ost: legt zunächst fest, dass sich das Folgende auf die Gruppe der Ostdeutschen bezieht. Anders als bei SIMPLIS ist der Name hier nicht völlig frei wählbar, sondern wurde mit der Gruppierungsanweisung in Zeile 6 festgelegt. Im Anschluss daran stellen die Zeilen 12 und 13 noch einmal den Bezug zwischen den Indikatoren imbleco und imwbcnt und den Faktoren CULT und OEK her, damit die entsprechenden Parameter separat für beide Gruppen geschätzt werden. Die beiden Leitvariablen dürfen hingegen nicht noch einmal aufgeführt werden, da hier die Faktorladungen in beiden Gruppen auf den Wert von 1 festgelegt sind.

Zeile 14 erscheint zunächst etwas kryptisch. In der Mplus-Syntax bezeichnen eckige Klammern den Achsenabschnitt einer Variablen. Dementsprechend werden hier für alle beobachteten Variablen – das Minuszeichen ermöglicht es wie in Stata und SIMPLIS kompakt auf alle vier Variablen zu verweisen – die Schätzung eigener Achsenabschnitte für die zweite Gruppe angefordert. Analog dazu setzt Zeile 15 die Mittelwerte der Faktoren auf den Wert 0 [4]. Dies entspricht der Option means() in Zeile 5 des Stata-Listing 3.4 auf Seite 87. Ohne diese Anweisung würde Mplus bereits an dieser Stelle die Abweichung zwischen den Gruppenmittelwerten zu schätzen versuchen.

Listing 3.9 zeigt, wie sich die Annahme der metrischen Invarianz in Mplus überprüfen lässt. Von Listing 3.8 unterscheidet es sich lediglich dadurch, dass die Beziehungen zwischen CULT und OEK und den Indikatoren imbleco und imwbcnt nun nicht mehr aufgeführt werden. Infolgedessen werden für beide Gruppen identische Pfadkoeffizienten geschätzt.

Listing 3.10 schließlich enthält keinerlei gruppenspezifische Anweisungen. Folglich wird das Modell unter der voreingestellten Annahme skalarer Invarianz geschätzt. Die Faktormittelwerte für die ostdeutschen Befragten werden wie in Stata und LISREL/SIMPLIS als Differenzen zur westdeutschen Referenzgruppe ausgegeben.

1 Data:

2 File is ess w1 mgcfa raw . dat ;

3 Variable:

4 Names are

5 imtcjob imbleco imueclt imwbcnt ost ;

6 Grouping is ost (0 = west 1 = ost ) ;

7 Model:

8 OEK BY imtcjob imbleco ;

9 CULT BY imueclt imwbcnt ;

10

11 Model ost :

12 [ imtcjob imwbcnt ] ;

13 [ OEK CULT@0 ] ;

Listing 3.9 MCFA in Mplus (metrische Invarianz)

1 Data:

2 File is ess w1 mgcfa raw . dat ;

3 Variable:

4 Names are

5 imtcjob imbleco imueclt imwbcnt ost ;

6 Grouping is ost (0 = west 1 = ost ) ;

7 Model:

8 OEK BY imtcjob imbleco ;

9 CULT BY imueclt imwbcnt ;

Listing 3.10 MCFA in Mplus (skalare Invarianz)

In die bei Drucklegung aktuellste Version von Mplus (7.1) wurden einige Erweiterungen der Syntax aufgenommen, mit deren Hilfe sich Gruppenvergleiche kompakter und damit weniger fehleranfällig formulieren lassen. Beispielsweise kann mit der Anweisung Model = Configural ; die Annahme konfiguraler Invarianz überprüft werden. Analog dazu funktionieren die Befehle Model = Metric ; und Model = Scalar ;. Außerdem steht nun mit Alignment ein Optimierungsverfahren zur Verfügung, mit dessen Hilfe die Suche nach invarianten Strukturen in Datensätzen mit einer großen Zahl von Gruppen wie etwa dem ESS teilweise automatisiert werden kann (Davidov et al. 2014, S. 68). Über Einzelheiten informiert ein Addendum zum Handbuch (statmodel.com/download/ Version7.1xLanguage.pdf).

Abschließend soll noch darauf hingewiesen werden, dass sich die Methode des Gruppenvergleichs generalisieren lässt: Beim MEHR-GRUPPEN-STRUKTURGLEICHUNGSMODELL (MGSEM) werden nicht nur Mess-, sondern vollständige Modelle über Gruppengrenzen hinweg getestet. Dementsprechend kann empirisch geprüft werden, ob weitere Invarianzen, etwa der Beziehungen der Faktoren untereinander, der Varianz der Faktoren oder der Effekte exogener Variablen vorliegen. Eine detaillierte Vorstellung des MGSEM würde über den Rahmen dieser Einführung hinausgehen. Grundsätzlich ähnelt das Vorgehen aber sehr stark der in diesem Kapitel skizzierten MGCFA.

  • [1] 9 Die Terminologie in der Literatur ist uneinheitlich. Über alternative Bezeichnungen informieren Little und Slegers 2005; Brown 2006, S. 268–269 sowie Davidov et al. 2014
  • [2] In der dritten Zeile der Ausgabe weist Stata noch einmal auf die Wichtigkeit dieses Verhältnisses zwischen beiden Modellen hin
  • [3] Daraus ergibt sich, dass Zeile 14 und Zeile 16 eigentlich entfallen könnten. Im Sinne einer möglichst nachvollziehbaren Darstellung wurden diese Anweisungen hier trotzdem wiederholt
  • [4] Der Mittelwert ist hier als „Achsenabschnitt“ der Faktoren zu verstehen, deshalb werden wiederum eckige Klammern verwendet
 
Fehler gefunden? Bitte markieren Sie das Wort und drücken Sie die Umschalttaste + Eingabetaste  
< Zurück   INHALT   Weiter >
 
Fachgebiet
Betriebswirtschaft & Management
Erziehungswissenschaft & Sprachen
Geographie
Informatik
Kultur
Lebensmittelwissenschaft & Ernährung
Marketing
Maschinenbau
Medien und Kommunikationswissenschaft
Medizin
Ökonomik
Pädagogik
Philosophie
Politikwissenschaft
Psychologie
Rechtswissenschaft
Sozialwissenschaften
Statistik
Finanzen
Umweltwissenschaften