Und täglich grüßt das Mafo-Tier: Social Media und Repräsentativität

Oliver Tabino (Q | Agentur für Forschung)
Oliver Tabino (Q | Agentur für Forschung)

Von Oliver Tabino, Geschäftsführer linkfluence / Q I Agentur für Forschung

Das Thema Repräsentativität in der Markt- und Sozialforschung ist enorm wichtig. Für viele unserer Kolleginnen und Kollegen ein ähnlich heiliger Gral wie die Anonymität.

Deswegen sollten Sie jetzt auf keinen Fall weiterlesen, denn in diesem Beitrag wird eine schockierende Wahrheit offenbart: Social Media Research und Social Media Monitoring ist nicht repräsentativ. Debatte beendet. Der Artikel somit auch.

This is the end… my representative friend….

Klaus Wübbenhorst sollte es wissen. Hier seine Definition von Repräsentativität:

„Eine Stichprobe ist dann repräsentativ, wenn ihre Ergebnisse ohne systematischen Fehler auf die Grundgesamtheit hochgerechnet werden können. Ein Sonderfall einer repräsentativen Stichprobe ist eine proportionale Stichprobe, bei der alle Anteile in der Stichprobe den Anteilen in der Grundgesamtheit entsprechen. Ist das interessierende Merkmal jedoch sehr ungleich in der Grundgesamtheit verteilt, dann ist es oft sinnvoll, die Einheiten, welche mehr von dem interessierenden Merkmal auf sich vereinen, stärker zu berücksichtigen. So sind Stichproben von Handelspanels grundsätzlich disproportional angelegt. Eine solche Stichprobe ist dann repräsentativ, wenn das Ausmaß der Disproportionalität bekannt ist. Diese wird für die Berichterstattung dadurch wieder ausgeglichen, dass die Stichprobeneinheiten unterschiedliche Hochrechnungsfaktoren erhalten.“

Und schon im ersten Satz haben wir den Salat: Wie groß ist nochmal das Web? Groß. Das ist klar, aber wie groß genau? Die Damen und Herren von der Volkszählung haben irgendwie ein Problem, das ist auch klar. Die eher ironische Vorbemerkung hat einen sehr ernsten Hintergrund:

Repräsentativität ist schlicht und ergreifend nicht möglich, weil wir die Grundgesamtheit nicht kennen und somit auch nicht sagen können, ob es systematische Fehler gibt. Gerade im Social Media Monitoring-Bereich gibt es immer wieder Fragen und Diskussionen über die Quellenabdeckung und es gilt meistens: Je mehr, desto besser. Aber eine Frage kann niemand, auch wir nicht, beantworten: Deckt das Monitoring nun 100%, 50%, 10% oder 1% des Internets ab? Und nochmal: Was ist überhaupt dieses Internet? Sprechen wir von sozialen Netzwerken, von Foren, von einzelnen Threads in Foren, von Personen, die in einem Forum diskutieren, von einzelnen Tweets, von Blogs oder Bloggern? Online-Medien?

Kritiker können nun sagen: Genau, das ist alles unklar, deswegen taugt das alles Nichts!

Ich behaupte: Für viele Fragegestellungen und Aufgaben ist Repräsentativität im statistischen Sinne nicht relevant.

Außerdem behaupte ich: Es gibt ein Verfahren Repräsentativität im Web in den Griff zu bekommen, es wendet nur kaum jemand an!

Die Vermessung des Webs

Während ein Monitoring das Web oder soziale Netzwerke auf Basis von Suchworten durchsucht und die zu den Suchworten passenden Posts, Satzfragmente, Tweets, etc. findet, gehen wir bei linkfluence einen anderen Weg. Wir finden die Merkmalsträger und somit Objekte der Forschung, also Menschen und nicht nur das, was sie diskutieren und schreiben. Darin besteht ein elementarer Unterschied zur herkömmlichen Social Media Forschung. Denn: So bekommen wir das Thema Repräsentativität im statistischen Sinne auch in der Social Media Forschung in den Griff.

Was unterscheidet uns: Wir definieren die Grundgesamtheit, kennen somit die Grundgesamtheit und können somit repräsentative oder zumindest - nach der Definition von Klaus Wübbenhorst - proportionale Stichproben im Web ziehen. Auch wir wissen nicht, wie die Grundgesamtheit „das Web“ sich zusammensetzt, aber wir sind in der Lage, einzelne Segmente aus dem von uns definierten Web-Sample herauszugreifen, die wir Tribes nennen. Diese Tribes können wir sehr gut thematisch abgrenzen und empirisch Verbindungsstrukturen und Austauschbeziehungen vermessen. Wir kennen dadurch die Struktur der thematischen Tribes. In der Pharmaforschung können wir dadurch beispielsweise sicherstellen, dass wir Patienten oder Stakeholder, die sich aktiv mit einer bestimmten Indikation oder einem Krankheitsbild im Web auseinandersetzen, erfassen und visualisieren. Es entsteht eine Art biotisches Themenpanel. Das hat nichts mit einer bevölkerungsrepräsentativen Stichprobe im klassischen Sinne zu tun, muss es aber auch nicht, denn in diesem Fall ist der Untersuchungsraum das Web und für das spezifische Thema können wir Repräsentativität im Web herstellen.

Jedem Tierchen sein Pläsierchen oder Repräsentierchen…

Ich möchte aber auch nochmal auf die andere Behauptung eingehen, denn immer wieder wird das Thema Repräsentativität über Alles übergestülpt und wird somit zur gerne unüberlegt übernommenen Killerphrase.

Wie können Trends repräsentativ sein?

Eine typische Fragestellung in der Social Media Research ist das Aufspüren von Trends. Wenn wir also beispielsweise technische Trends und technische Entwicklungen im Bereich Nahrungsmittel aufspüren sollen, dann suchen wir nach Weak Signals. Das können exotische Früchte sein, „Wunderpflanzen“ aus dem Amazonas, spezielle Verpackungen aus Asien, etc. Diese Weak Signals können und müssen nicht repräsentativ sein, auch die Menschen, die darüber schreiben, müssen das nicht sein. Wir verstehen sie als Lead- oder Avantgardenutzer – wie die klassische Trendforschung das auch übrigens auch schon immer macht. Die Diskussion um statistische Repräsentativität erübrigt sich. Darüber hinaus gibt es im Monitoring noch eine charmante Möglichkeit die Weak Signals in Echtzeit zu verfolgen und zu sehen, wann die Signale nicht mehr nur schwach, sondern immer stärker und viral werden.

Der Influencer, das unbekannte Wesen.

Die sogenannten Influencer sind ebenfalls ein typisches Social Media Research Thema. Influencer sind Meinungsmacher. In der Politikforschung würde man von Agenda-Settern sprechen, im Marketing vielleicht von Brand-Ambassadors. Eine klassische Repräsentativitäts-Perspektive macht meines Erachtens auch hier überhaupt keinen Sinn. Die oben erwähnte Methode ist zielführender, weil ein Influencer immer in einem Kontext „Einfluss“ nimmt. Der Kontext ist in diesem Fall der „Tribe“ und die unterschiedlichen Tribes haben eigene Gesetze und Mechanismen. Im einen Tribe ist man Influencer und bedeutend und im anderen spielt man keine Rolle. Im Sprachgebrauch der Mafo könnte man also von einer quotierten Stichprobe sprechen.

Need for speed.

Schnelligkeit ist ein hohes Gut in dieser Branche. Informationen scheinen allgegenwärtig und in Echtzeit abrufbar. Methoden wie das Social Media Monitoring verführt dazu und auch die Dashboardisierung lässt uns glauben (oder vielleicht auch hoffen), dass schnelle Analysen und somit schnelle Entscheidungen problemlos machbar sind. Trotz oder gerade wegen dieser Entwicklungen glaube ich, dass die Balance zwischen Schnelligkeit und qualitativ hochwertiger Arbeit nicht immer einfach zu finden ist und oft muss man Kompromisse eingehen. Plug & Play, Echtzeit und Co. setzen Standards und dabei wird immer wieder vergessen, dass auch im Web nicht alles „for free“ ist, dass gute Arbeit Zeit braucht und etwas wert ist. Das hat nicht direkt etwas mit Repräsentativität zu tun, aber mit Qualität! Und auch in der Social Media Forschung sind klassische Gütekriterien wichtig – neu interpretiert und angepasst an die neuen Rahmenbedingungen. So bleiben wir als Branche relevant, so liefern wir relevante Lösungen für die Probleme und Herausforderungen unserer Auftraggeber.

Veröffentlicht am: 15.10.2014

 

Kommentare (3)

  1. Sebastian Kohlert am 16.12.2014
    "Wir finden die Merkmalsträger und somit Objekte der Forschung, also Menschen und nicht nur das, was sie diskutieren und schreiben."

    Bringt es auf den Punkt. Das entspricht genau meiner Vorstellung von digitaler Forschung. In Deutschland gibt es maximal eine Hand voll "Agenturen", die dies verstanden haben.
  2. Matthias Hallmann am 15.10.2014
    Ich teile ihre Ansicht, stelle aber fest, dass es in dieser Diskussion auch nichts Neues gibt.
    Unabhängig davon, dass seit Ende der 90er Social Media und Blogs etc. hinzugekommen sind, ist das Internet nach wie vor nicht repräsentativ zu erforschen.
    Dass das in den allermeisten Fragestellungen nicht relevant ist, sehe ich auch so...
    Ergo: Es bleibt alles wie es ist. schade ;)
  3. Bernhard Hebel am 15.10.2014
    Hi Oliver,
    dazu nur kurz drei Anmerkungen eines Statistikers:
    Punkt 1) jede Stichprobe ist repräsentativ, zumindest für die Stichprobe!
    Punkt 2) Die Repräsentativität einer Messung (z.B. Mittelwert) ist für jedes einzelne Merkmal zu prüfen (also nicht für eine Erhebung als Ganzes) und hängt stark von der Streuung des Merkmales ab. So ist die durchschnittliche Größe von Menschen relativ leicht und verlässlich zu messen, egal in welcher Region wir uns befinden (außer bei den Pygmäen). Dagegen ist das Durchschnittsgehalt schon etwas schwieriger.
    Punkt 3) Mit Zunahme der Stichprobe (es müsste eine Zufallsstichprobe sein, was meist nicht der Fall ist)reduziert man die Streuung des Schätzwertes, dummerweise steigt aber auch der Einfluss des systematischen Fehlers (den man übrigens auch nicht durch Schichtung ausgleicht) sondern einfach versucht zu verhindern.

    Das bedeutet: wer keine Zufallsstichprobe hat, kann sich das Thema Schätzgenauigkeit sparen und sollte nur von den Ergebnissen der Stichprobe reden.

Neuen Kommentar schreiben

Kommentare geben ausschließlich die Meinung ihrer Verfasser wieder. Die Redaktion behält sich vor, Kommentare nicht oder gekürzt zu veröffentlichen. Das gilt besonders für themenfremde, unsachliche oder herabwürdigende Kommentare sowie für versteckte Eigenwerbung.

Über marktforschung.de

Branchenwissen an zentraler Stelle bündeln und abrufbar machen – das ist das Hauptanliegen von marktforschung.de. Unser breites Informationsangebot rund um die Marktforschung richtet sich sowohl an Marktforschungsinstitute, Felddienstleister, Panelbetreiber und Herausgeber von Studien, Marktdaten sowie Marktanalysen als auch an deren Kunden aus Industrie, Handel und Dienstleistungsgewerbe.

facebook twitter google plus