Julia Kroth, infas 360 Open Data – Welche Möglichkeiten frei verfügbare Daten für Data Science liefern

Durch Open Data können schnell und kostengünstig Daten gesammelt und für Data Science – und somit für Wirtschaft, Politik und Wissenschaft – nutzbar gemacht werden. Doch wie funktioniert das und was muss dabei beachtet werden?

Julia Kroth, infas360 (Bild: infas360)

Unter Data Science versteht man die Generierung von Wissen aus Daten. Daten haben wiederum unterschiedlichste Quellen – sowohl private als auch öffentliche. Der Anteil an Open Data nimmt stetig zu, wodurch immer mehr kostengünstige Sekundärforschung ermöglicht wird und mehr Informationen als Entscheidungsgrundlage für unser Handeln generiert werden können. Die Corona-Krise hat uns wieder eindrucksvoll gezeigt, wie wichtig Daten sind. Wir werden täglich mit Statistiken, Tabellen und Karten konfrontiert. Viele dieser Daten sind frei verfügbar. Aber auch in anderen Bereichen – wie z. B. in der Marktforschung oder im Geomarketing – bietet Open Data gute Möglichkeiten, um Wirtschaft, Politik und Wissenschaft bei der optimierten Entscheidungsfindung zu unterstützen.

Open Data in der Marktforschung

Die Vorteile der Sekundärforschung liegen auf der Hand: Die Daten sind günstig und schnell verfügbar. Dafür sind sie in der Regel nicht aktuell und beantworten die Forschungsfragen nicht hundertprozentig genau. Aber für eine erste Informationsgewinnung kann Open Data durchaus sinnvoll sein. Eine Primärmarktforschung – z. B. in Form einer Befragung, die genau auf die zu beatwortenden Fragestellungen angepasst wird – kann dann ja immer noch nachgelagert und die Erkenntnisse der Sekundärforschung können somit präzisiert werden.

Open Data und die Corona-Krise

Seit Beginn der Pandemie (Anfang Februar 2020) sammelt infas 360 Daten zur Darstellung des regionalen Infektionsgeschehens. Dazu zählen u. a. die tagesaktuellen Corona-Daten der Gesundheitsministerien wie z. B. Infektionszahlen und Todesfälle oder die Belegung der Intensivbetten aus dem DIVI-Register. Ende 2020 hat infas 360 zusätzlich – gemeinsam mit dem infas Institut, dem Institut für Hygiene und Öffentliche Gesundheit der Universität Bonn (IHPH) – eine zentrale Datenplattform für Bund und Wissenschaft aufgebaut. Dazu wurden und werden immer noch im Auftrag des Bundesministeriums für Wirtschaft und Energie (BMWi) alle für die Pandemie relevanten sozio-demographischen und sozio-ökonomischen Regionaldaten zusammengetragen. Den Grundstock der Plattform bilden die bereits bestehenden, umfassenden Datenbanken. Durch moderne Technologien wie Web-Crawling, -Scraping und KI-Methoden können diese durch weitere frei verfügbare Daten, wie die Intensivbettenbelegung (DIVI-Register), ergänzt werden, sodass die Corona-Datenplattform unter Zuhilfenahme von Open Data einen Beitrag zur evidenzbasierten Politikberatung leisten kann.

Open Data im Geomarketing

Im Geomarketing unterscheidet man zwischen Mikro- und Marktdaten. Mikrogeographische Daten sind in der Regel auf feinräumiger Ebene verfügbar – z. B. Siedlungsblöcke oder Straßenabschnitte bis hin zu adress- bzw. gebäudegenauen Daten. Marktdaten beziehen sich hingegen auf höhere räumliche Aggregate wie Postleitzahlgebiete oder Gemeinden. Um diese Daten genau einer geographischen Position zuzuordnen, werden wiederum Geodaten benötigt. Ein Kerngebiet der infas 360 ist es, diese Daten zu sammeln und zu analysieren, um Unternehmen bei der Lokalisierung von Zielgruppen, der Standort- oder der Vertriebsgebietsplanung zu unterstützen.

Bei allen drei Arten von Daten kann neben privaten auch auf frei verfügbare Datenquellen zurückgegriffen werden, obwohl der Großteil der Daten immer noch aus kostenpflichtigen Quellen stammt. Selbst amtliche Daten sind häufig nicht frei verfügbar. Im Hinblick auf die frei nutzbaren Geodaten wird beispielweise von OpenStreetMap (z. B. für die Points of Interest) Gebrauch gemacht. Darüber hinaus sind Stadtteile und Flurstücke, aus denen wiederum z. B. die Grundstückgrößen abgeleitet werden, teilweise frei verfügbar. Auch in die Erstellung bzw. Berechnung der Mikro- und Marktdaten fließen einige Daten aus Open Data Quellen ein (z. B. Zensus, Statistische Ämter des Bundes und der Länder, Destatis, Kraftfahrt-Bundesamt, Bundesamt für Kartographie und Geodäsie u. v. m.).

Allerdings ist längst nicht jeder Open Data Datensatz nutzbar. Manchmal ist nicht ersichtlich, was der Inhalt des Datensatzes ist und wie dieser generiert wurde. Dies kann besonders dann der Fall sein, wenn die Datenquelle nicht amtlich ist. Dennoch kann alles in allem festgehalten werden, dass Open Data einen wichtigen Beitrag zur Erstellung der umfangreichen Datenbank mit über 700 Mikro- und weiteren über 1.000 Marktdaten leistet.

Fazit

Daten dienen der Wirtschaft, Politik und Wissenschaft als Grundlage für zielgerichtetes Handeln. Dabei ist ein 360-Grad-Blick auf Daten und Ihre Quellen durchaus sinnvoll. infas 360 sammelt und analysiert beispielsweise nicht nur Marktforschungsdaten, sondern auch Geo-, Mikro-, Markt-, Firmen-, CRM- und pandemiebezogene Daten. Und das unter Einsatz aller privaten und öffentlichen Datenquellen. Open Data bietet dabei hervorragende Möglichkeiten der schnellen und kostengünstigen Datensammlung, auch wenn die frei verfügbaren Daten durchaus mit Vorsicht zu genießen sind. Sekundärforschung findet also nicht nur in der Marktforschung, sondern in allen Bereichen der Data Science Anwendung und unterstützt bei der immer wichtiger werdenden Informationsgewinnung durch Daten.

Über Julia Kroth

Julia Kroth, infas360 (Bild: infas360)
Julia Kroth ist als Senior Consultant Data Science bei infas 360 tätig. Seit 4,5 Jahren ist sie dort für die Marktforschungsstudien und damit verbundene Analysen zuständig. Zuvor hat sie ein Bachelorstudium der Wirtschaftspsychologie und ein Masterstudium der Markt- und Medienforschung an der TH Köln absolviert.

Täglicher Newsletter der Insightsbranche

News +++ Jobs +++ Whitepaper +++ Webinare
Wir beliefern täglich mehr als 9.000 Abonnenten
 

Diskutieren Sie mit!     

Noch keine Kommentare zu diesem Artikel. Machen Sie gerne den Anfang!

Um unsere Kommentarfunktion nutzen zu können müssen Sie sich anmelden.

Anmelden

Weitere Highlights auf marktforschung.de