Korrespondenzanalyse
[engl.: analysis of correspondence]
Die Korrespondenz stammt vom Wort her vom lateinischen "correspondentia" ab, was "gegenseitige Beantwortung" bedeutet. Landläufig wird unter dieser Benennung auch die beidseitige Kommunikation zwischen zwei Personen verstanden. Im wissenschaftlichen Kontext ist der Korrespondenzbegriff aber erweitert. Gemeint ist die allgemeine wechselwirkende Einflussnahme zweier Sachverhalte. Um welche Art Entitäten es sich dabei handelt, ist beliebig. Die Korrespondenzanalyse ist ein statistisches Verfahren, um Rückschlüsse aus dieser wechselseitigen Einflussnahme zu ziehen bzw. ihr Vorhandensein überhaupt festzustellen. Ein häufiger Fehler bei der Korrespondenzanalyse ist deshalb, sie mit der Korrelationsanalyse zu verwechseln. Dabei wird auf ähnlichen graphischen Entwicklungen oder Häufigkeitsverteilungen auf wechselseitige Zusammenhänge rückgeschlossen. Dies ist in vielen Fällen aber falsch bzw. nur zufällig bedingt.
Definition Korrespondenzanalyse
Mit der Korrespondenzanalyse ist ein Verfahren aus der multivariaten Statistik gemeint, welches Beziehungen von Variablen mithilfe einer Kontingenztafel untersucht. Die Abkürzung der Korrespondenzanalyse ist CA, von "Correspondenz analysis". Sie ermöglicht zwei Kreuz- oder Matrixtabellen in einem grafischen Punktmuster in einem Koordinatensystem abzubilden. Eine andere Benennung der Korrespondenzanalyse ist die "Hauptkomponentenanalyse mit kategorialen Daten".
Verfahren der Korrespondenzanalyse
Ziel der Korrespondenzanalyse ist die Reduzierung der ausgewerteten Daten auf eine zweidimensionale Darstellung. Dies hat sich erfahrungsgemäß als praktisch erwiesen, da sie den üblichen Lesegewohnheiten entspricht. Dies wird dadurch erreicht, indem die Kategorienzahl jeder Variable so lange reduziert wird, bis die gewünschten zwei Dimensionen erreicht sind.
Zur Verringerung der Dimensionen wird eine normierte Darstellung gewählt. Grundlage der Korrespondenzanalyse ist deshalb in den meisten Fällen eine einfache Kreuztabelle, wie sie z. B. bei Häufigkeitsuntersuchungen üblich sind. Hat man mehrere dieser Tabellen, lassen sie sich über standardisierte Verfahren zu einem Punktmuster zusammenfassen.
Das Ergebnis ist, dass nicht mehr die Objekte für sich alleine im Graph dargestellt werden, sondern sie gemeinsam mit ihren Eigenschaften als Punkt erscheinen.
Für Korrespondenzanalysen stehen heute auch Tools zur Verfügung, welche die Auswertung automatisiert durchführen können. Das senkt bei Darstellungen komplexerer Analysen die Fehlerwahrscheinlichkeit.
Grenzen der Korrespondenzanalyse
Problematisch an der Korrespondenzanalyse ist die korrekte Auswertung der visualisierten Daten. Das Objekt wird gemeinsam mit seinen Eigenschaften auf einer Ebene visualisiert. Die Distanz der Objekte zueinander lässt darauf schließen, wie ähnlich oder unähnlich sind. In dem Punkt folgt die Korrespondenzanalyse der Darstellung der basierenden Graphen. Problematisch wird es, wenn Objekte und Merkmale miteinander verglichen werden. Um dies zu erreichen, müssen die Merkmale zunächst als Achsen des Koordinatensystems festgelegt werden. Die Versuchung liegt hier nahe, dreidimensionale Koordinatensysteme zu wählen, da sich darin Häufungen plastischer darstellen lassen. Solange aber kein passendes Interface in Form eines Bildschirms und einer entsprechenden Animationssoftware zur Verfügung steht, ist dieses Verfahren nicht empfohlen. Solange die Korrespondenzanalyse gedruckt oder anders zweidimensional dargestellt werden soll, ist das entsprechende X/Y Koordinatensystem aussagekräftiger.
Anwendungen der Korrespondenzanalyse
Die Korrespondenzanalyse ist ein statistisches Werkzeug mit einem breiten Anwendungsfeld. Übliche Anwendungen sind Marktforschungen, Raumnutzungen oder medizinische Erhebungen, z. B. aus der Seuchenbekämpfung. In Summe ist sie ein mächtiges Werkzeug, dessen Anwendung jedoch einiges an Vorkenntnissen und Übung benötigt.