Natacha Dagneaud, Séissmo Liebe Oma...: Künstliche Intelligenz (er)zählt

Natacha Dagneaud, Gründerin Séissmo (Bild: Séissmo)
Liebe Oma,
du weißt ja, dass ich so einen komischen Beruf ausübe: ich beobachte Menschen stundenlang, ich stelle Fragen (nicht ganz wie die Journalisten!) und deute anschließend die Antworten – dabei achte ich genau auf das Schweigen wie auf das laute Lachen... Denn die meisten Menschen lügen. Das hast Du mir früh beigebracht.
Stell Dir vor: Heute gibt es Computer, mit Hilfe derer wir einen neuen Blick auf unsere Arbeit werfen können. Bei diesen langen Interviews entsteht nämlich eine Unmenge an Wort. Wir haben gerade 27 Frauen mitten in den Wechseljahren sieben Tage lang in ihrem Alltag begleitet (über ein Online-Blog, stell Dir so ein elektronisches Tagebuch vor) und mussten plötzlich 189 ganze Seiten Antworten auswerten. Das waren 92.669 Wörter! Das Zählen der Wörter ist übrigens kein Hexenwerk, das kann das Programm Microsoft Word – das darf man nicht mit Künstlicher Intelligenz verwechseln.
Ja, Du hast mir schon so früh das Lesen beigebracht (erinnerst Du Dich an die verbotene Leihgabe von Boris Vians Roman "Ich werde auf eure Gräber spucken" vor meinem 15. Geburtstag?) aber so viel lesen und dabei alles sezieren? Und das in wenigen Tagen?
Oder wie neulich: Da haben wir 40 Menschen befragt, die ihre Lebensmitteleinkäufe in unterschiedlichen Supermärkten machen. Gemäß der Methode des "Kognitiven Interviews", die wir ironischerweise von der Polizei geklaut haben. Dabei erzählt ein Mensch über eine Stunde lang und sehr frei (dabei aber stets konzentriert, vertieft in seiner Welt, als würde er die Episode noch einmal durchleben), was er bei einem ganz konkreten Ereignis selbst wahrgenommen hat. Das ist eine wissenschaftliche Methode zur Erhöhung der Gedächtnisleistung, damit man genauere Zeugenaussagen erhält. Das mache ich mal mit Dir, wenn Du wieder einmal Deine Schlüssel suchst.
Jedenfalls haben wir da im Durchschnitt 4.500 Wörter pro Transkript – das ergibt 180.000 Wörter (ohne überflüssige Zeichen dazu!), die mein Gehirn verarbeiten muss. Das ist dann klar, dass ich einiges filtere. Natürlich ganz unbewusst. Ich merke mir bestimmte Aspekte besser, weil sie in mir etwas auslösen. Ich weiß zwar, dass ich da sehr wachsam sein muss. Meine Kollegen auch – trotzdem sind wir Menschen und eben keine Roboter.
Deshalb haben wir vor einem Jahr den Kontakt mit vielen Anbietern von solchen klugen Systemen gesucht und arbeiten nun zum Beispiel seit über acht Monaten mit Synomia an konkreten Projekten zusammen. Die sitzen in Paris, können aber viele Sprachen in ihrem System verarbeiten (derzeit nutzen wir Englisch, Deutsch und Französisch). Bisher arbeiten sie mit unseren quantitativen Kollegen, die eher wenig komplizierte Sätze verarbeiten, dafür aber von vielen Personen. Bei uns qualitativen Forschern ist es umgekehrt: wir befragen eher wenige Menschen, die dafür aber sehr viel Text produzieren.
Wir arbeiten sehr eng mit der Forschung & Entwicklung dort, um unsere Bedürfnisse und Anforderungen klar zu machen. Zum Beispiel war uns der Kontext, aus dem jedes Wort, jeder Satz stammt, sehr wichtig. Da haben die für uns eine Extra-Funktion eingebaut, die uns erlaubt, bei einem verbatim (also dem O-Ton eines Verbrauchers) den vorherigen Satz leicht einsehen zu können.
Wir erhalten einen Zugang zu einer ganz privaten Plattform, in der unsere Texte – unsere Probanden-Interviews – "gelagert" werden, bis wir sie "codieren", sie also einem sinnvollen Thema zuordnen. Wir können alles sortieren, suchen, gruppieren, Themen und Empfindungen kategorisieren. Das Chaos lässt sich meistern. Aber warum soll es überhaupt interessant sein, Wörter zu zählen? Schließlich reden nicht alle Menschen gleich viel. Und mit diesem System besteht das Risiko, dass sich die Redseligsten mehr Gehör verschaffen.
Aber ist es auch nicht so, dass wir in der Regel nicht viel zu sagen haben, wenn das Thema uns kalt lässt? Wissen wir nicht instinktiv, dass wir viel über Dinge reden können, die uns (auf/er)regen? Ja, es ist egal, was Menschen über eine Werbung denken, so lange sie heftig und viel darüber streiten – denn während sie ein "Wort darüber verlieren (!)", setzen sie sich gleichzeitig der Botschaft erneut aus!
Deshalb müssen wir vor der "Menge" Achtung haben – gerade als qualitative Forscher.
Ich möchte Dir erzählen, was die Einführung dieser Software (man nennt sie SaaS, das ist so wie damals Dein Abo von Reader's Digest, nur virtuell) an meiner Arbeit bzw. an meinem Handwerk ändert. Ein bisschen so wie bei der Waschmaschine, als sie sich verbreitete. Klug vorsortieren und die richtige Temperatur einstellen musst Du noch selber – auch das Aufhängen. Die Maschine ersetzt also nicht Dein Denken, aber sie macht die Drecksarbeit und sogar ziemlich feinfühlig, wenn Du sie richtig steuerst. Aber packst Du das Falsche rein, kommt Blödsinn raus.
Genauso ist es mit Künstlicher Intelligenz und Syntax-Software (heißt nur: der Computer versteht den Satz durch seinen grammatikalischen Aufbau). Die saubere Analyse von Verben, Adjektiven, Nebensätzen, Pronomen, Syntagmen... lässt mich schmunzeln, dass der Latein-Unterricht doch nicht umsonst war. Vor allem stellt uns das vor große Aufgaben:
- Nach welchen Prinzipien sortieren wir die "Wäsche", also die Texte? Dürfen wir die Sätze der Interviewer und Moderatoren inkludieren oder werden diese "abfärben"? Denn manche Interviewer (und das macht die Maschine sichtbar) reden mehr – manchmal zu viel.
- Wie kommen wir überhaupt von Audio-Aufnahmen auf elektronische Transkripte? Das kostet Zeit, Geld und erfordert eine große Ausbildung der Protokollanten.
- Denn... Wie legt man die Satzzeichen? Denn die Maschine betrachtet Sätze bzw. Satzteile als Sinneseinheit und "schneidet" sie entlang der Zeichensetzung. Wenn ein Mensch ein Erlebnis schildert ("und ... mmmh... dann...") ist es alles ein Satz, also eine Einheit? Oder dürfen unsere Protokollanten (und sollen sie) Punkte bzw. Semikola dazwischen setzen? Das bedingt am Ende die Gesamtzahl von verbatim, anhand derer die Themengewichtung erfolgt. Insofern nicht ganz so unbedeutend!
- Wie erklärt man unseren Kunden und Auftraggebern, dass sich die plötzlich auftauchenden Prozentzahlen auf Wörter und nicht auf Menschen beziehen? Von statistischer Relevanz kann hier keine Rede sein.
Durch diese maschinelle Bearbeitung werden Wörter erkannt, klassifiziert und gezählt. Bisher haben wir dies mit unserem Kopf gemacht: Wir haben Sinneinheiten beim Lesen erkannt, sie rausgeschrieben und anschließend in Berichte verfasst, die meistens lange Sätze beinhalten. Unser Beweismaterial für unsere Thesen waren die Verbraucherzitate und unsere Interpretation dazu. Bisher wäre es niemandem eingefallen, einzelne Wörter oder Redewendungen zu zählen. Es wäre händisch vollkommen irrsinnig. Und das ist das Interessante: Unsere bisherige Arbeit bleibt weiterhin erhalten, sie ist noch immer notwendig, aber die Maschine eröffnet uns weitere Möglichkeiten der Verarbeitung unseres Rohmaterials und lässt uns Quali-Forscher tiefer blicken. Ich persönlich liebe zum Beispiel die fokussierte Betrachtung auf die Verben, während ich analysiere, weil sie die Intention verraten.
Wie lösen wir allerdings die mögliche ungleiche Behandlung zwischen redseligen und wortkargen Probanden? Indem wir verschiedene Themen untereinander vergleichen, und damit bleibt alles relativ. Wenn bei dem Test einer neuen Natur-Coloration plötzlich das Thema "Henna-Duft" oder "Bauernhof-Gerüche" spontan und oft in den Wiedergaben auftauchen, dann sind die gleichen Proportionen zwischen beiden Typen – also den stillen und lauten Gesprächspartnern – anzutreffen. Das begründet die Legitimität dieser Themen und deren relativen Bedeutung im Gesamtbild.
Die Summe der Stimmen macht's sichtbar: so wie hier auf dem Bild. Die Menschen, die in D einkaufen, haben so viel weniger Stationen besucht und am Ende einen kleineren Warenkorb eingekauft. Der Laden schafft es nicht, sie lange aufzuhalten und sie auf dem Weg zu verführen.

Zum Schluss muss ich Dir aber unbedingt ein paar lustige Anekdoten erzählen, die ich dank der KI entdeckt habe, die mein IQ nicht erfasst hatte.
Einmal ging es um die Bedeutung von Brot. Es war das achthäufigste Wort in unserer letzten Studie zum Thema Lebensmitteleinkauf. Natürlich war mir klar, dass Brot beim Einkaufen oft vorkam und in einem französischsprachigen Land von hoher Bedeutung ist. Dafür braucht keiner eine teure Maschine. Und dennoch rückte es noch einmal die Wichtigkeit dieser Produktkategorie ins richtige Licht. Vor allem dann, wenn sich diese Information mit den Sinneseindrücken im Laden koppeln ließ. Denn dann war klar: Ohne Brot-Duft keine Freude im Laden!
Ein anderes Mal habe ich gestaunt, als ich den Wert von Verneinungen entdeckte. Ich beachte tendenziell mehr die Aussagen: Was hat ein Mensch getan, gewählt, in die Hand genommen... Das Programm ist aber so klug, dass ein Mensch etwas getan oder NICHT getan hat. Heißt: Es identifiziert, ob eine Verneinung in einem Satz vorkommt. So konnte ich herausfinden, in welchen Läden die Shopper ein Vermeidungsverhalten an den Tag legten. In den teureren Supermärkten hatten sie eine Art Selbstbremse verinnerlicht, also berichteten sie überproportional oft von "nicht kaufen/ nicht in die Hand nehmen".
Bei einem Antischuppen-Shampoo gab es eine Formel mit orange-schimmernder Farbe und eine mit einer weißen, cremigen Konsistenz. Der Hersteller wollte wissen, ob die orangene Farbe ein Problem sei. Anstatt die Menschen direkt zu fragen und sie mit der Nase darauf zu stoßen, haben wir sie ihre Haarwäsche-Erlebnisse erzählen lassen und sofort sehen können, wie sehr die Farbgebung ein bemerkenswerter Pfeiler der Produktidentität mit starken Assoziationen war.
Voilà, Oma, es gibt noch viel zu sagen und ich verspreche, Dich auf dem Laufenden zu halten – aber auch hier, in diesem Schreiben, sind mir die Wörter gezählt.
Natacha
Kommentare (1)
Um unsere Kommentarfunktion nutzen zu können müssen Sie sich anmelden.
Anmelden