Social Media-Sensors Neue Analyse-Dimension durch georeferenzierte Social Media-Daten

Wie kann man sicherstellen, möglichst viele Eindrücke von einem Event zu sammeln, ohne diese händisch bereinigen zu müssen?
Die Lösung ist das Monitoring mittels Geo-Fence, also einem durch Koordinaten beschriebenen, begrenzten Raum. Diese Abfrage ermöglicht es, alle Posts mit Geo-Tags zu erfassen, die innerhalb dieses Raumes abgesendet wurden, unabhängig vom eigentlichen Inhalt. Durch die Eingrenzung auf die Veranstaltungsorte und -zeiträume, konnten wir die Posts bestimmen, die wirklich während der Veranstaltung geteilt wurden.
Zusätzlich wird klar, dass sich dadurch die Pforten zu einer neuen analytischen Dimension öffnen. Hotspots und Bewegungsmuster können identifiziert und wiederum in den Kontext mit den Aussagen der Nutzer gesetzt werden - die Verbindung von geobasierten und inhaltsbezogenen Daten von Nutzern.
Was genau sind Geo-Tags?
Sobald jemand ein Foto zum Beispiel auf Facebook postet und den Ort tagged, wird eine Koordinate als Metainformationen zu dem Post abgespeichert. Außerdem sind die meisten Smartphones mit einem GPS-Empfänger ausgestattet und speichern den genauen Ort ab, an dem das Foto gemacht wurde. Dies kann wiederum genutzt werden, um den Ort zusammen mit dem Foto auf Flickr oder anderen Portalen zu teilen.
Welche Daten kann man auswerten und wie bekommt man sie?
Grundsätzlich können nur Daten erfasst werden, die von Nutzern freigegeben werden. Facebook und Twitter zum Beispiel stellen hierfür eigene Schnittstellen (APIs) zur Verfügung, um mittels Geo-Fence, der meist durch vier Koordinaten beschrieben wird, öffentliche Posts zu erhalten. Bei Instagram war das bis vor kurzem auch möglich, allerdings wurde diese Funktion nach dem Skandal um Cambridge-Analytica eingestellt (Allerdings war eine Abschaltung dieses Zugriffes ohnehin für Ende des Jahres geplant). Weitere APIs, die derartige Funktionen bieten, sind u.a. Google Places oder AirBnB. Es gibt auch Drittanbieter, die spezielle Tools für das Monitoring von Social Media im Raum anbieten und einige Monitoring-Dienstleister haben derartige Funktionen schon implementiert. Es gibt auch eine Menge DIY-Tutorials und Tools, mit denen die Erfassung der Daten recht unkompliziert möglich ist.
Der Aufwand zur Datenerhebung ist begrenzt und die einfache Verfügbarkeit von Daten ist gegeben, wie sieht es mit der Aufbereitung und Analyse aus?
Neben dem Herausfiltern von Bots oder anderem werblichem Content, der für die Analyse nicht relevant ist, hängt die Aufbereitung und Analyse stark von der Fragestellung ab. Meist ist es sinnvoll, die Daten mit weiteren relevanten Informationen zu veredeln. Dies geschieht mit sogenannten Shapefiles, durch die sich Koordinaten auf beispielsweise Wohnblocks hochaggregieren lassen, um den Datensatz dann um demographische Informationen zu erweitern. Solche Shapefiles werden wiederum von unterschiedlichen Anbietern angeboten, u.a. auch kostenlos von offiziellen Statistik-Ämtern. Andere Analysen erfordern die Identifikation von Bewegungsprofilen und Mustern oder dem Auswerten von Inhalten, wobei unterschiedliche Methoden dabei zum Einsatz kommen können.
Geo-Daten stellen eine Brücke zwischen dem inhaltsgetriebenen Social Media-Content und der realen Welt her. Durch die Kombination mit weiteren Datenquellen wird der User weiter charakterisierbar und die Aussage im Post steht nun in einem differenzierteren Kontext.
Anwendungsbeispiele aus ersten Studien:
"Place of Interest" und Hotspots
- Sobald sich Menschen im öffentlichen Raum bewegen, kann ein Social Media Monitoring mittels Geo-Fence wichtige Insights generieren. Dabei kann es sich um Konzerte, Sportereignisse, Demonstrationen oder beliebte Touristenattraktionen handeln.
- Bestimme Orte, die zu gewissen Zeiten besucht werden, lassen auch Rückschlüsse auf die Zielgruppe zu. Bei Demonstrationen und Parteitagen liegen dies auf der Hand. Auch andere Zielgruppen lassen sich damit identifizieren. So ist es möglich, Parks zu identifizieren, die häufig für sportlichen Aktivitäten aufgesucht werden. Diese Information kann man zum Beispiel nutzen, um OoH-Kampagnen zu steuern. Das Aufkommen von Posts an diesem Ort sagt nicht nur indirekt etwas darüber aus, welcher Ort stärker frequentiert wird, es sagt vor allem etwas darüber aus, wie hoch das virale Potential an diesem Ort ist.

Bewegungsmuster- und Profile
- Über die aggregierten Besuche von Usern, die einen Post senden, können Bewegungsprofile aufgezeichnet werden. Auf einer Kulturmeile wie der documenta lässt sich so herausfinden, in welcher Reihenfolge die Museen besucht werden oder welche Bars nach dem Besuch von bestimmten Restaurants angesteuert werden. Diese Analysen können mit anderen Quellen, wie zum Beispiel den Bewegungsprofilen, die vom Mobilfunkanbieter aggregiert zur Verfügung gestellt werden, angereichert werden.
- In Längsschnitt-Analysen lassen sich im Vergleich von Tag/Nacht oder Wochentag/Wochenende Verlagerungen von Hotspots oder Muster ausmachen. Auch dies kann interessant sein für unterschiedliche Fragestellungen, von Außenwerbung bis zur Identifikation von Szenevierteln.

Content meets Location
All die bisher erwähnten Analysen beziehen sich hauptsächlich auf die georeferenzierten Meta-Informationen. Richtig spannend wird die Analyse, wenn man den Inhalt miteinbezieht.
- Meinungsäußerungen können in Kontext von Orten und Segmenten betrachtet werden. Auch das erlaubt viele Anwendungen, wie zum Beispiel die Analyse von regionalen Unterschieden bei der Nennung von bestimmten Produkten, um die Steuerung von Targeting-Kampagnen zu verbessern.
- Langzeiteffekte wie Gentrifizierung oder Veränderungen in der Social Media Kommunikation aufgrund von massiven Baumaßnahmen lassen sich damit auch bestens beobachten.
Wo liegen die Grenzen von geobasierten Social Media-Analysen?

Bei all diesen Anwendungsbeispielen stellt sich natürlich die Frage nach der Validität der Ergebnisse. Dem sind wir auch nachgegangen. In zwei Studien zur US Presedential Election 2016 und zur Bundestagswahl 2017 konnten wir bisher beweisen, dass es einen Zusammenhang zwischen dem Aufkommen von Tweets und dem Wahlausgang gibt (siehe hier und hier). Aber ist Social Media deshalb repräsentativ? Zu den demographischen Merkmalen der Nutzer wurden bereits viele Studien veröffentlicht. Um den Bias wirklich einschätzen zu können, ist eine andere Frage wichtig: Wer ist überhaupt aktiv und teilt öffentlich seinen Standort bzw. was ist die Motivation dahinter, seinen Standort bei einer Meinungsäußerung zu teilen?
Für die Bundestagswahl 2017 in Deutschland haben wir den Bevölkerungsteil, der über die #BTW17 twittert und den Standort teilt, genauer beleuchtet. Hierfür haben wir auf Kreisebene versucht, charakteristische Attribute zu finden, welche das Teilen von Geo-Informationen erklären. Bei der Analyse haben wir 55 Indikatoren gegeneinander getestet. Das Ergebnis war nicht überraschend, bringt aber zumindest ein kleines Licht ins Dunkel. Geo-referenzierte Tweets zur #BTW17 werden dort gepostet, wo es dichter besiedelt ist sowie weniger Arbeitslose, mehr Partei-Mitglieder und mehr Studenten leben. Dies stellt nur einen ersten Versuch dar, den Bias besser einordnen zu können. Letztlich ist noch viel mehr Forschung notwendig, um den Fehler einzuschätzen und damit valide Ergebnisse zu erzielen. Weitere zukünftige Herausforderung sind die abnehmende Datenverfügbarkeit (siehe die Abschaltung der Instagram-API) und die sich grundsätzlich schnell verändernde Social Media-Welt.
Wir sind jedenfalls von den weitreichenden Möglichkeiten der Analyse von georeferenzierten Social Media-Daten überzeugt.
Für diejenigen, die mehr darüber erfahren möchten, haben Simon Kühne und ich ein Tutorial zur Datenerhebung, -aufbereitung und -analyse mit vielen Beispielen in der aktuellen DGOF-Schriftenreihe veröffentlicht.
Über den Autor

Yannick Rieder ist Senior Research Manager bei Q | Agentur für Forschung in Mannheim und verantwortlich für die Entwicklung innovativer Methoden.
Kommentare (0)
Noch keine Kommentare zu diesem Artikel. Machen Sie gerne den Anfang!
Um unsere Kommentarfunktion nutzen zu können müssen Sie sich anmelden.
Anmelden