Die automatisierte Textanalyse: die perfekte Symbiose qualitativer und quantitativer Marktforschung?

Von João Filipe Baigger, Rogator AG
Offene Fragen in der Online-Marktforschung werden gerade bei zu erwartenden größeren Stichproben aufgrund ihrer zeit- und kostenintensiven Auswertung oft gemieden oder nur sporadisch eingesetzt. Dabei sind es gerade die qualitativen Erhebungsmethoden, die ein breites Spektrum an Ableitungen und Informationen bieten. Sie können also sowohl einige methodische als auch inhaltliche Vorteile bieten, wenngleich quantitative Erhebungen in Bezug auf ihre Vergleich- und Auswertbarkeit komfortabler waren.
Aufgrund des bisher hohen manuellen Aufwands zur Analyse qualitativer Daten verwundert es nicht, dass es zwischenzeitlich eine Reihe von Softwarelösungen gibt, die diesen Prozess erheblich vereinfachen sollen. Die Auswertung qualitativer Daten erfordert nämlich nicht nur die Sichtung und Einordnung der semantisch unterschiedlichen Texte, sondern auch die anschließende Quantifizierung der Daten, um Sie mit anderen Datensätzen vergleichbar zu machen.
Der gemeinsame Nenner nahezu aller angebotenen Lösungen dieser Problematik ist ihre deduktive Auslegung. Das heißt im Vorfeld der eigentlichen Datenanalyse muss ein Modell erstellt werden, in das die Daten automatisch durch das System verortet werden. Nachteil solcher Lösungen ist jedoch, dass der Modellaufbau im Vorfeld der Analyse relativ zeitaufwendig ist und für eine einmalig durchgeführte Ad-hoc-Studie kaum lohnt.
Die von Rogator entwickelte Web-Applikation RogTCS ist dagegen rein induktiv angelegt (let the data tell the story), d.h. sie ermöglicht es, unstrukturierte Daten aus offenen Fragen, ohne Voraufwand innerhalb kürzester Zeit zu analysieren und verwertbar zu machen. Die unstrukturierten Daten werden zunächst in die Anwendung geladen, woraufhin diese vollautomatisch analysiert und den vom System gebildeten Themenclustern zugeordnet werden. Die Themencluster werden des Weiteren automatisch vom System mit aussagekräftigen Beschreibungen versehen und liefern so auf einen Blick mit enormem Komfort die wichtigsten Daten. Zusätzlich werden alle Nennungen hinsichtlich ihres Sentiments analysiert und mittels einer Farbskala in Clustern auf einer sog. "Semantic-Map" visualisiert.
Technisch stellt sich der Analyseverlauf folgendermaßen dar:
Zunächst werden die Eingabedaten vollautomatisch analysiert. Dazu wird das Textmaterial eingangs einer auf Umfragetexte optimierten computerlinguistischen Vorverarbeitung unterzogen. Längere Nennungen werden dabei in mehrere Teilabschnitte zerlegt, um die folgenden Analyseschritte zu erleichtern.
Anschließend wird eine Sentimentanalyse durchgeführt, die positive und negative Nennungen (bzw. Teilnennungen) erkennt. Diese sogenannte Polarität wird auf einer Skala von –1 (sehr negative Einstellung zu dem angesprochenen Thema) bis +1 (sehr positive Einstellung) beschrieben. Liegt der Polaritätswert nahe 0, so konnte keine positive oder negative Wertung identifiziert werden. Dies ist bspw. bei einer objektiven Äußerung von Fakten der Fall.
Der abschließende und zentrale Arbeitsschritt besteht in einer vollautomatisierten thematischen Analyse der Nennungen. Im Gegensatz zu früheren Ansätzen nimmt die Anwendung hierbei keine Verschlagwortung vor, sondern fasst inhaltlich ähnliche (Teil-)Nennungen zu Themenclustern zusammen. Auf diese Weise kann auch ohne umfangreiche branchenspezifische Schlagwortlisten ein Großteil der Nennungen automatisch einem oder mehreren identifizierten Themenclustern zugewiesen werden. Für jedes Thema werden einige charakteristische Begriffe bestimmt, die den Inhalt des Clusters möglichst treffend beschreiben. Darüber hinaus berechnet die Applikation die Ähnlichkeit verschiedener Themencluster, wodurch diese zu größeren Themenfeldern gruppiert werden können.
Die Ergebnisse der vollautomatischen Analyse werden graphisch veranschaulicht. Jedes Themencluster wird durch einen Kreis auf einer zweidimensionalen "Semantic-Map" visualisiert.
Insgesamt nimmt dieser Prozess nur wenige Minuten in Anspruch. Durch den induktiven, automatisierten Ansatz ist die Applikation einfach zu bedienen, der Fokus liegt auf der Visualisierung der Ergebnisse, die dem Nutzer in kürzester Zeit einen fundierten Überblick zu den erhobenen Daten gibt. Der Fokus liegt also ganz klar darauf, große Informationsmengen mit hoher Usability in verwertbare Informationen umzuwandeln.
Der Autor:
João Filipe Baigger, Dipl.-Pädagoge (univ.)/Betriebswirt (VWA), verfügt über langjährige Erfahrung in der Marktforschung, empirischen Sozialforschung sowie der Personal- und Organisationsentwicklung. Schwerpunkt seines Engagements für die Rogator AG ist neben den "klassischen" Marktforschungsthemen, Conjoint- und Pricing-Studien sowie das Thema Online-Mitarbeiterbefragungen. Vor seiner Tätigkeit für die Rogator AG führte er empirische Forschungsprojekte für verschiedene Bundesministerien und diverse öffentliche Träger durch.
Weitere Informationen zum Unternehmen auf marktforschung.de:

Kommentare (1)
Um unsere Kommentarfunktion nutzen zu können müssen Sie sich anmelden.
Anmelden