< Zurück   INHALT   Weiter >

2.6.2 Schätzverfahren

Ein vollständig spezifiziertes Strukturgleichungsmodell besteht aus einer Vielzahl von Annahmen über Zusammenhänge zwischen den nicht beobachtbaren latenten Variablen und ihren Indikatoren sowie zwischen den latenten Variablen untereinander. Stärke und Richtung dieser Zusammenhänge, d. h. die Parameter des Modells, müssen aus den Daten geschätzt werden. Hierzu existieren verschiedene Verfahren, die aber alle auf derselben Grundüberlegung beruhen und in der Tendenz, d. h. wenn das Modell korrekt spezifiziert ist, alle weiteren Anwendungsvoraussetzungen erfüllt sind und der Umfang der Stichprobe gegen unendlich geht, zu denselben Ergebnissen führen.

Unabhängig vom konkreten Verfahren geht man bei der Parameterschätzung immer davon aus, dass die eigentlich interessanten Variablen und Zusammenhänge nicht beobachtbar sind. Was wir jedoch beobachten können, sind die Kovarianzen zwischen den manifesten Variablen, die in der empirischen Kovarianzmatrix S zusammengefasst werden. Wie in Abschn. 2.5 gezeigt, kann diese Matrix als Resultat von Modellstruktur und Parametern des Modells rekonstruiert werden.

Zur Bestimmung der unbekannten Parameter des Modells existiert – anders als im Fall der linearen Regression – keine analytische Lösung. Stattdessen beginnt jedes Schätzverfahren mit einer Reihe von plausiblen Startwerten für diese Parameter und berechnet aus diesen Startwerten sowie den Annahmen über die Struktur

des Modells eine vom Modell implizierte Kovarianzmatrix ζ. Diese unterscheidet sich aus zwei Gründen von der empirischen Kovarianzmatrix S: Zum einen handelt es sich lediglich um eine erste Schätzung für die Parameter, zum anderen basiert S selbst ja nur auf einer Stichprobe und wird sich deshalb von der wahren Kovarianzmatrix in der Grundgesamtheit (ζ) unterscheiden [1].

In den nun folgenden Schritten, die als Iterationen bezeichnet werden, variiert der Computer immer wieder systematisch und simultan die Parameterschätzungen, um die Differenzen zwischen ζ und S zu reduzieren, bis sich keine nennenswerten

Verbesserungen mehr erzielen lassen. Dieses Stadium des Schätzverfahrens heißt KONVERGENZ.

Insbesondere bei komplexen Modellen ist jede Iteration mit einem hohen numerischen Aufwand verbunden, der erst seit den 1990er Jahren in vertretbarer Zeit bewältigt werden kann. Die verschiedenen Schätzverfahren unterscheiden sich u. a. darin, wie in der Iterationsphase die jeweils nächste Generation von Schätzwerten erzeugt und wie die Differenzen zwischen ζ und S berechnet und bewertet werden (Diskrepanzfunktion).

Traditionell wurden Strukturgleichungsmodelle mit Hilfe des MAXIMUM-LIKELIHOOD-VERFAHRENS (ML) geschätzt, das – vereinfacht gesprochen – diejenigen Parameterschätzungen findet, die mit maximaler Wahrscheinlichkeit die vorliegende Stichprobe hervorgebracht haben könnten. ML hat eine Reihe von attraktiven mathematischen Eigenschaften, ist in allen relevanten Programmen implementiert und wird noch heute häufig angewandt.

Allerdings ist seine Anwendung an Voraussetzungen geknüpft, die in der politikwissenschaftlichen Forschungspraxis nicht oder nur zum Teil erfüllt sind. Erforderlich ist nämlich, dass alle Variablen des Modells einer gemeinsamen MULTIVARIATEN NORMALVERTEILUNG folgen [2].

Eine notwendige, aber nicht hinreichende Voraussetzung für eine multivariate Normalverteilung ist, dass jede einzelne Variable individuell normalverteilt ist (Burdenski 2000). Dies trifft auf politikwissenschaftliche Daten in aller Regel nicht zu. Vielmehr ist deren Verteilung üblicherweise schief, eventuell auch mehrgipflig, und die Streuung der Werte entspricht nicht den Vorgaben der Normalverteilung. Vor allem aber ist die Normalverteilung ein Modell für kontinuierliche Daten. Politikwissenschaftliche Daten hingegen weisen in vielen Fällen nur einige wenige Ausprägungen auf und werden damit strenggenommen lediglich auf kategorialem Niveau gemessen (vgl. dazu auch Abschn. 4.1).

Die Entwicklung eines weiteren Schätzverfahrens, das unter den Bezeichnungen WEIGHED LEAST SQUARES (WLS) oder ASYMPTOTICALLY DISTRIBUTION FREE (ADF) bekannt ist, stieß deshalb gerade in der Politikwissenschaft auf großes Interesse. Wie der zweite Name schon sagt, setzt dieses Verfahren keine bestimmte Verteilung der Messwerte voraus und ist damit für politikwissenschaftliche Forschungsprobleme besonders geeignet. WLS/ADF ist allerdings weniger effizient [3] als ML, wenn die Daten tatsächlich multivariat normalverteilt sein sollten, und erfordert „große“ Stichproben. Zudem erweist sich ML in der Praxis als erstaunlich robust gegenüber Verletzungen der Normalverteilungsannahme, während WLS/ADF empfindlich auf Fehlspezifikationen des Modells reagiert (Olsson et al. 2000).

Die Vorstellungen darüber, was unter „groß“ zu verstehen ist, gehen auseinander. Boomsma (2000, S. 471) nimmt an, dass für Modelle mit mehr als 14 manifesten Variablen „mehrere tausend“ Fälle benötigt werden. Andere Autoren setzen einen Bedarf von ca. 2000 Fällen an. Neuere Simulationsstudien, die allerdings auf weniger komplizierten Modellen zu basieren scheinen, sprechen dem Verfahren auch in kleineren Datensätzen sehr positive Eigenschaften zu (StataCorp 2013). Zumindest für die Analyse von standardisierten Interviews, wo die Fallzahl oft im Bereich von n = 1000 oder mehr liegt, scheint WLS/ADF damit oft eine sehr gute Alternative zum ML-Verfahren zu sein, sofern das Modell nicht zu komplex ist. Auch WLS/ADF ist in allen gängigen Programmen implementiert.

ML und WLS/ADF sind für die Praxis die wichtigsten Schätzverfahren. Über ihre mathematischen Grundlagen sowie über einige alternative Verfahren informiert Reinecke (2014, Kap. 6.5). Kaplan (2009, Kap.5.1), der zu einer eher kritischen Einschätzung von WLS/ADF kommt, diskutiert eine Reihe von neueren Verfahren, die aber nicht in allen Programmen implementiert sind. Einen weiteren aktuellen Überblick haben Lei und Wu (2012) vorgelegt.

  • [1] Damit ist S eine Schätzung für die wahre, unbekannte Kovarianzmatrix in der Grundgesamtheit. ζ ist eine weitere, allerdings konditionale, d. h. unter Vorbehalt der Gültigkeit des Modells stehende Schätzung für ζ und wird in der Literatur deshalb manchmal auch mit dem Symbol ζˆ bezeichnet
  • [2] Die multivariate Normalverteilung ist eine Verallgemeinerung der univariaten Normalverteilung. Während diese die Verteilung einer einzelnen Variablen durch zwei skalare Parameter, nämlich einen Mittelwert μ und eine Varianz σ 2 beschreibt, ist die multivariate Normalverteilung ein Modell für die gemeinsame Verteilung mehrerer Variablen. Dementsprechend sind ihre Parameter ein Vektor μ und eine Kovarianzmatrix ζ, deren Länge bzw. Dimensionen sich aus der Zahl der Variablen ergeben
  • [3] „Effizienz“ hat in diesem Zusammenhang eine sehr spezifische Bedeutung: Gemeint ist, dass bei gleichem Stichprobenumfang über eine große Zahl von Anwendungen hinweg Schätzungen nach dem ML-Verfahren weniger stark um die wahren Werte in der Grundgesamtheit streuen als Schätzungen nach dem WLS/ADF-Verfahren. Damit ist allerdings nichts über die praktische Bedeutung dieses Unterschiedes oder die auf eine konkrete Stichprobe bezogene Qualität der Schätzungen gesagt
 
< Zurück   INHALT   Weiter >