Wiki / Lexikon - Erklärungen zu über 1.000 Fachbegriffen aus Marktforschung und Marketing

Explorative Statistik
[engl.: exploratory statistics]
Die explorative Statistik schließt sich der deskriptiven Statistik an. Bei dieser werden die erhobenen Datensätze grafisch dargestellt. Typische Beispiele sind Punktmuster, Funktionskurven, Histogramme oder Mosaik-Plots. Im Anschluss an die deskriptive Statistik versucht die explorative Statistik aus den dargestellten Daten Rückschlüsse zu ziehen.
Explorative Statistik – die Erforschung der Daten
Die Bezeichnung „Explorativ“ bedeutet „forschend“ oder „untersuchend“. Sie setzt auf die deskriptive, also beschreibende Darstellung der erhobenen Datensätze auf. Ziel der explorativen Statistik ist es, Hypothesen und Vermutungen über den Datensatz anzustellen. Damit lässt sich die weitere Untersuchung des Sachverhalts gezielter anstellen. Dazu verwendet diese Statistikmethode verschiedene Werkzeuge. Die Auswertbarkeit der Daten hängt dabei vom Visualisierungstyp ab. Es kann sich daher lohnen, diverse Visualisierungen zu testen, um verwertbare Darstellungen zu erhalten. Folgende Visualisierungen sind zur Darstellung von Daten typisch:
- Funktionsgraphen
- Streudiagramme
- Histogramme
- Paretodiagramme
- Stamm-Blatt-Diagramm
Funktionsgraphen haben den Vorteil, dass sie Trends und Häufigkeiten gut anzeigen. Sie lassen sich sehr gut mit bekannten Funktionen vergleichen, wie beispielsweise einer Sinuskurve, einem exponentiellen Wachstum oder einer Gauß´schen Verteilung. Diese Methode eignet sich besonders dann gut, wenn nur wenige Daten zur Verfügung stehen.
Streudiagramme stellen die Daten als Punktmuster bzw. Punktwolke dar. Der Vorteil dieser Darstellung ist, dass Ausreißer besser erkannt werden. Es liegt im Ermessen des Datenanalysten, diese Abweichler zu ignorieren oder näher zu erforschen.
Histogramme eignen sich besser als Funktionsgraphen dazu, eine Häufigkeitsverteilung festzustellen. Sie haben in der Regel die typische Normalverteilung und können mit den entsprechenden Methoden erfasst und interpretiert werden. Typisch für Histogramme ist, dass wenige Daten zum Treffen von korrekten Annahmen ausreichen.
In einem Paretodiagramm werden die Daten der absoluten Größe nach geordnet und gleichzeitig ihrer prozentualen Verteilung gegenübergestellt. Das dient zur geordneten Ermittlung von Wahrscheinlichkeiten. Diese Methode neigt aber dazu, Ausreißer und Messfehler strukturell zu ignorieren.
Das Stamm-Blatt-Diagramm ist ein Verfahren, welches speziell für die explorative Statistik entwickelt wurde. Sie verwendet keine grafischen Hilfsmittel, sondern wertet die Daten mithilfe der dazu entwickelten Tabelle aus. Dieses Verfahren eignet sich gut für die Kommunikation und Diskussion innerhalb der Forschungsgruppe oder im Austausch mit gleichwertig qualifizierten Personen. Für die Kommunikation nach außen ist sie weniger gut geeignet, da für ihre Interpretation ein hohes statistisches Wissen erforderlich ist.
Anwendung in der Marktforschung
Die besondere Stärke der explorativen Statistik liegt darin, den gleichen Datensatz aus unterschiedlichen Perspektiven betrachten zu können. Je nach Fragestellung lassen sich die vorhandenen Daten unterschiedlich interpretieren. Das macht die explorative Statistik besonders wirtschaftlich. Die erhobene Datenbasis ist in der Regel nur sehr gering. Die Mehrfachauswertung der als valide befundenen Informationen ist damit besonders budgetfreundlich. Ein typisches Beispiel für die explorative Statistik ist die Marktforschung. Die Zuordnung bestimmter Produkte an definierte Zielgruppen lässt sich mithilfe dieser Statistikmethode sehr gut vorbereiten.
Vergleich mit Inferenzstatistik und deskriptiver Statistik
Die deskriptive Statistik liefert die Grundlagen für die explorative Statistik, indem sie die Daten sammelt und grafisch aufbereitet. Die explorative Statistik betrachtet die Darstellungen in ihrer Gesamtheit und wertet sie anhand bekannter Muster (z.B. Normalverteilung) aus. Sie liefert die Vorarbeit für die Inferenzstatistik. Hier kommen erweiterte Methoden zum Einsatz, um aus den vorliegenden Informationen Trends, Validitäten oder andere Prognosen zu extrapolieren.
Grenzen der explorativen Statistik
Da die explorative Statistik einen aus Stichproben gebildeten Trend mit bekannten Verläufen vergleicht, ist das Risiko von Fehlinterpretationen groß. Korrelationen können zufällig gebildet werden. Außerdem tendiert die explorative Statistik dazu, Ausreißer zu ignorieren.