#nr21 | Datenjournalismus
Workout für Algorithmen

Wie klug Künstliche Intelligenz im Redaktionalltag agiert, hängt davon ab, wie gut wir sie trainieren.

von Vivien Ulm

Geht es um die gezielte Recherche in großen Datenmengen, kann KI als Werk­zeug für Journalist:innen sehr hilfreich sein. Das zeigen Beispiele wie die gro­ße Schufa-Recherche des Bayerischen Rundfunks (BR) und des Nachrichten­magazins Der Spiegel oder die Untersu­chung des Schweizer Fernsehens zu Fa­ke-Followern bei Schweizer Influencern. Denn mithilfe von KI ist es möglich, Informationen aus Datenbanken oder Open Source Intelligence (s. Glossar) zu sammeln oder selbst Datenbanken zu erstellen und diese auszuwerten.

Christina Elmer, stellvertretende Ent­wicklungschefin beim Spiegel und demnächst Professorin an der Techni­schen Universität Dortmund, erklärt: „Künstliche Intelligenzen haben mit lernenden Systemen zu tun, die auf Daten aufbauend Muster erkennen und diese Muster auf neue Daten anwen­den können.“ Hintergrund dieser Ent­wicklung im Journalismus ist neben der Digitalisierung die Datafizierung. „Und gerade eine Kombination aus neuen Methoden der Datenanalyse mit tra­ditioneller journalistischer Recherche ermöglicht am Ende eine sehr gute Ge­schichte“, sagt Ulrike Köppen, Leiterin des Datenteams beim BR.

Üben, üben, üben

KI erleichtert die Arbeit von Journalist:innen durch die Abnahme von repetitiven Aufgaben: Zusammenfas­sen, Übersetzen oder Transkribieren von Texten sowie Suchmaschinenop­timierung. Das schafft mehr Raum für Kreativität und Zeit für neue Ideen.

Richtiges Training: Die Zusammensetzung der Daten, mit denen KI trainiert wird, sollte sorgfältig ausgewählt werden, sonst droht ein Bias. Foto: Kristina Alexanderson (Internetstiftelsen) CC-by-sa

Richtiges Training: Die Zusammensetzung der
Daten, mit denen KI trainiert wird, sollte sorgfältig ausgewählt werden, sonst droht ein Bias. Foto: Kristina Alexanderson (Internetstiftelsen) CC-by-sa

Jedoch sind sich Journalist:innen der genauen Funktionsweise der neuen Tools oft nicht bewusst. Timo Gros­senbacher, Projektleiter Automated Journalism bei der Schweizer Medien­gruppe Tamedia, spricht gar von einer „Black Box“.

Elmer erklärt: „KI kann erst dann gut unterstützen, wenn man den Bereich klar definiert hat, die von der KI auf­genommenen Informationen gut ma­nagen und mit den Ergebnissen strate­gisch weiterarbeiten kann.“ Es braucht demnach ein Grundwissen – eine Algo­rithmic Literacy –, wie Werkzeuge mit KI entstehen.

Denn KI kommt dort an ihre Grenzen, wo sie falsch eingesetzt wird. Wer mit KI sinnvoll recherchieren will, braucht „eine allgemeine Affinität zu Techno­logie-Entwicklungen, Verständnis von Datenanalysen und -auswertungen, Kenntnisse von Programmen, Tools und deren Steuerung und redaktionsspezi­fische Teamkompetenzen“, sagt Frank Hänecke, Studienleiter der Schweizer Journalistenschule MAZ. Besonders wichtig ist das interdisziplinäre Arbei­ten zwischen Journalismus, Program­mieren, Statistik und insbesondere Maschinellem Lernen. „Der Vorteil von interdisziplinären Teams ist, dass man aus verschiedenen Perspektiven auf ein Thema schaut. Das ergibt interessante­re Hypothesen und die Möglichkeit, in der Redaktion verschiedene Lösungs­ansätze zu entwickeln“, sagt Köppen.

Dazu bedarf es immer neuer Impulse, Reflexion und eines ständigen Trai­nings der Algorithmen. Denn nur wenn man weiß, wie ein Algorithmus mit Da­ten umgeht, kann Fehlern vorgebeugt werden. Für die Spiegel-Journalistin Elmer liegt „eine Gefahr in dem Prin­zip, dass eine künstliche Intelligenz aus den Daten der Vergangenheit lernt und die darin gefundenen Muster und Regeln auf die Zukunft anwendet. Nicht immer wollen wir die Verhältnisse der Vergangenheit aber unsere Zukunft prägen lassen.“

Falsche Grundannahmen

Konkret heißt das: Enthalten Datensät­ze, mit denen Algorithmen zu Trainings­zwecken gefüttert werden, beispielswei­se demographische Verzerrungen (z.B. Überrepräsentation einzelner Gruppen) kann das zu einem Bias gegenüber an­deren, oft sozial benachteiligten Grup­pen (z. B. Frauen, People of Colour, Ho­mosexuelle, Migranten oder religiöse Minderheiten) führen.

Frauen werden beispielweise in auto­matisierten Bewerbungs- oder Kredit­systemen oft benachteiligt, da Män­ner in der Vergangenheit bevorzugt wurden. Auch Menschen mit dunkler Hautfarbe werden von automatischen Seifenspendern ignoriert oder von selbstfahrenden Autos übersehen, weil in den Trainingsdaten mit hellhäutigen Menschen trainiert wurde. Abgesehen von solchen diskriminierenden Syste­men gibt es noch viele andere Berei­che, in denen Fehler auftreten.

Zu Beginn der Covid-Pandemie rech­nete die Weltgesundheitsorganisation (WHO) mit einer sehr hohen Mortali­tätsrate in Afrika. Das Horrorszenario trat zum Glück nicht ein. Ein Grund da­für: Die WHO hatte bei ihren Prognosen mit europäischen Modellen gearbei­tet. Afrikas sehr viel jüngere Bevöl­kerungsstruktur und die Erfahrungen vieler Länder im Umgang mit Infekti­onskrankheiten waren offenbar nicht ausreichend berücksichtigt worden.

Ein Blick in die Glaskugel

Wie sieht die Zukunft der KI im Jour­nalismus aus? Laut MAZ-Studienleiter Hänecke werden Recherchewerkzeuge weiter automatisiert und mit Daten­strömen verzahnt. Er meint: „Zukünfti­ge Journalist:innen werden häufiger in die Steuerung von KI und Algorithmen involviert sein. Es ergeben sich neue Anforderungen und Rollen, wobei sich klassische journalistische und neue technologiebasierte Kompetenzen und Aufgaben vermischen.“ Auch Grossen­bacher von Tamedia prophezeit ein besseres Miteinander von Mensch und Maschine, bei dem Maschinen mehr auf die Bedürfnisse von Journalist:innen ausgerichtet werden. Für Elmer, die bald Journalistik-Studierende mit KI vertraut machen wird, liegt die Zukunft in der Frage: Für wen werden die Inhalte aufbereitet? Sie sagt: „Wir werden zen­tral technischer werden, müssen uns aber, um weiterhin guten Journalismus zu leisten, mehr mit den Leser:innen auseinandersetzen und nutzer- und zielgruppenorientierter arbeiten.“

GLOSSAR
Lernende Systeme
Maschinen, Roboter und Soft­waresysteme, die Aufgaben auf Datenbasis selbstständig erledigen
Open Source Intelligence (OSINT)
nutzt Informationen aus offe­nen, frei verfügbaren Quellen zur Informationsgewinnung
Maschinelles Lernen
Teilgebiet der KI, bei dem Compu­ter lernen, „Muster zu erkennen und einzuordnen, um eigenständig bestimmte Probleme zu lösen“
Automatisiertes Schreiben
nach einem vorgegebenen Hand­lungsablauf erstellte Texte von Maschinen
1. Juli 2021