BVM - Vom Webscraping bis zum automatisierten Downloaden freier Daten mit R

02. Dezember 2022
Veranstaltungsort: online

Die Menge frei zugänglicher Daten im Internet wächst ungebrochen. Die Transparenz- und Open-Data-Bewegung der letzten Jahre führt dabei zu einem Bestand an qualitativ hochwertigen strukturierten Daten von nationalen und internationalen Behörden und Organisationen. Für die Marktforschung interessant sind auch Webdaten in Form wenig strukturierter Webseiten, Kundenrezensionen, Leserkommentaren, Social Media, Blogs, PDF-Berichten und RSS-Feeds. Mit Webscraping und Methoden des Textmining lassen sich hier informative Schätze heben.

Data Is Useless Without the Skills to Analyze It‘ - so die Headline eines Harvard Business Review-Beitrags. Das Seminar vermittelt, wie sich diese freien Daten effizient und reproduzierbar für die Marktforschung nutzen lassen. Beispielhafte Daten, Zeitreihen und Geoinformationen nationaler, europäischer und internationaler Einrichtungen werden in dem Seminar mit der Open-Source-Software R erschlossen. Gearbeitet wird mit sogenannten Packages, aber auch eigenen Funktionen bis hin zum Webscraping und der automatisierten Umsetzung von Texten und Zahlen aus PDF-Dateien. Die Teilnehmer/innen arbeiten mit unterschiedlichen Datenformaten. Sie lernen, Daten aus verschiedenen Quellen zu fusionieren, die aufbereiteten Daten in Excel oder SQL-Datenbanken zu speichern und ihre Ergebnisse in interaktiven tabellarisch-grafischen Dashboards zu präsentieren..

Lernziele

Die TeilnehmerInnen können am Ende des Seminars:

  • Datenquellen im Internet finden und ihre Struktur auf maschinelle Nutzbarkeit beurteilen
  • Die Strukturen relevanter Datenformate verstehen und nutzen
  • Allgemeine, aber auch spezifische R-Packages für die Erschließung von webbasierten Daten anwenden
  • Eigene Funktionen für einen Workflow von den Rohdaten bis hin zur Präsentation schreiben
  • Grundzüge des Webscrapings verstehen und anwenden

Für wen gedacht?

Marktforscher/innen mit Grundkenntnissen in R, die automatisiert Daten aus webbasierten, frei zugänglichen Quellen in ihre Studien einbinden oder für weiterführende Analysen nutzen wollen.

Mehr Informationen

 

Weitere Highlights auf marktforschung.de