Wo hat investigativer Journalismus in einer von KI geprägten Welt Platz?

11. April 2025 • Aktuelle Beiträge, Digitales • von

Bildquelle: Pixabay

Journalismus war schon immer auch ein Wächter des öffentlichen Interesses, der die Mächtigen zur Rechenschaft zieht. Das ist nicht nur eine berufliche Pflicht, sondern auch die Grundlage seines demokratischen Auftrags. An der Spitze dieses Kampfes für Transparenz und Gerechtigkeit steht besonders der investigative Journalismus. Aber heutzutage beschränkt sich Macht nicht mehr nur auf Regierungen. Tech-Giganten wie Meta, Google oder Apple kontrollieren nicht nur den digitalen Raum, sie prägen seine Infrastruktur. Große Technologieunternehmen sind zu neuen Einflusszentren geworden, die mit Staaten vergleichbar sind und über eigene Regeln, Verwaltungssysteme und soziale Verantwortung verfügen. So wie Journalist:innen früher die Handlungen von Regierungen überwacht haben, benötigen sie heute Instrumente und Fachwissen, um die Macht digitaler Plattformen zu überwachen. Darin besteht die  vielleicht wichtigste Herausforderung des modernen Journalismus.

Traditionelle journalistische Methoden sind oft nicht in der Lage, die technologische Komplexität und Undurchsichtigkeit zu bewältigen, die hinter großen Technologieunternehmen steht. Solche Unternehmen sind die wahren „Black Boxes“ der modernen Welt: Sie verfügen über Datenmengen von Regierungs- und Unternehmensgeheimnissen bis hin zu tiefgründigen Algorithmen, deren Verständnis spezielle technische Kenntnisse erfordert. Allerdings können Algorithmen im Gegensatz zu Menschen nicht zu einem Interview eingeladen werden. Und hier entsteht ein ernstes Problem: Journalist:innen haben es mit einer enormen Asymmetrie von Macht und Informationen zu tun. Die großen Plattformen mit ihren immensen finanziellen, technologischen und rechtlichen Ressourcen kontrollieren den Informationsraum fast vollständig.

Deshalb ruht die kritische Analyse der Algorithmen großer Technologieunternehmen größtenteils auf den Schultern spezialisierter Untersuchungsorganisationen wie ProPublica, The Markup oder Lighthouse Reports. Auch gemeinnützige Organisationen wie AlgorithmWatch, Systemic Justice und The Centre for Countering Digital Hate untersuchen die gesellschaftlichen Auswirkungen dieser Technologien. Außerdem diskutieren Forscher:innen zunehmend darüber, wie Künstliche Intelligenz den investigativen Journalismus verändern könnte. KI soll etwa helfen, verborgene Geschichten aufzudecken und mit großen Datenmassen zu arbeiten. Dieser Ansatz wurde bereits als “digitaler Wachhund “ bezeichnet.

Chatbot-Trainingsdaten und der Empfehlungsalgorithmus von TikTok

Die Forschung von Joris Weerbeek vom Fachbereich Medien- und Kulturwissenschaften der Universität Utrecht in den Niederlanden befasst sich mit der direkten Anwendung von KI bei journalistischen Ermittlungen. Im Rahmen seines Promotionsprojekts analysierte er zwei Fälle in Zusammenarbeit mit der niederländischen Wochenzeitung De Groene Amsterdammer. Die Zeitung wird von einer kleinen Redaktion mit 15 Journalist:innen geführt und hat 2020 in Partnerschaft mit niederländischen Universitäten die Initiative Data and Debate ins Leben gerufen, um Online-Debatten zu analysieren.

Die Forschungsmethodik basierte auf enger Zusammenarbeit zwischen Journalist:innen und Akademikerr:innen. Die Journalist:innen waren für die Suche nach Quellen, die Durchführung von Interviews und die Analyse von Dokumenten zuständig, während die Forscher:innen Methoden zur Datenanalyse entwickelten und mit Algorithmen arbeiteten. Der Arbeitsablauf umfasste wöchentliche formelle Treffen, gemeinsame Datenetikettierung und informelle Diskussionen. Das endgültige Material wurde von den Journalist:innen verfasst, jedoch mit Beiträgen der Forscher:innen. Diese Zusammenarbeit ermöglichte nicht nur die Erprobung von KI-Tools im Journalismus, sondern zeitgleich auch die Bewertung ihrer Wirksamkeit im realen Redaktionsumfeld.

Eine der wichtigsten Forschungsfragen der Initiative lautete: Welche Quellen ermöglichen es Large Language Models, ein hohes Maß an Sprachkompetenz in der niederländischen Sprache zu erreichen? Die Forscher:innen untersuchten dafür Daten aus dem Colossal Clean Crawl Corpus (C4) von Google, insbesondere dessen mehrsprachige Variante mC4. Diese enthält mehr als 95 Millionen niederländische Websites. Bei der Analyse der gefilterten Daten, die zum Trainieren von GPT-3 verwendet wurden, stellte das Team fest, dass die in das Modell aufgenommenen Inhalte stark von Auswahlalgorithmen beeinflusst waren. Diese Algorithmen bevorzugten englischsprachige Texte. Es wurde außerdem eine Reihe problematischer Inhaltstypen identifiziert, darunter persönliche Daten, urheberrechtlich geschütztes Material und Desinformationsseiten. Hier wurden die Risiken deutlich, die eine unzureichend kontrollierte Sammlung von Trainingsdaten für KI mit sich bringt.

Die Studie untersuchte auch, wie die App TikTok das Interesse on Nutzer:innen an Inhalten im Zusammenhang mit Essstörungen erkennt und wie schnell sie damit beginnt, verwandte Inhalte zu empfehlen. Zur Analyse der Videoinhalte nutzte das Team das CLIP-Modell, um die Beziehung zwischen Bildern und Text im Video zu bewerten.  Mithilfe automatisierter Konten auf physischen Smartphones verfolgten die Forscher:innen, wie lange der Algorithmus brauchte, um den Feed mit Videos zu diesem sensiblen Thema zu füllen. TikTok konnte die Empfehlungen in nur wenigen Minuten anpassen.  Die App ist also dazu in der Lage, versteckte Interessen ihrer Nutzer:innen schnell zu erkennen..

Geschwindigkeit, Personalisierung, Spielbarkeit

Insgesamt lassen sich drei Hauptkategorien erkennen, wie KI die Arbeit mit großen digitalen Plattformen verändert: Dabei geht es um Geschwindigkeit und Umfang, Personalisierung und Reproduzierbarkeit. Geschwindigkeit und Umfang ermöglichen es Journalist:innen, effizient mit riesigen Datenmengen zu arbeiten und Millionen von Datensätzen in kurzer Zeit automatisch zu klassifizieren. Das ist besonders bei Untersuchungen wichtig, bei denen es um Trainingsdatensätze für Chatbots geht. Hier hilft KI dabei, Inhalte zu organisieren und sie für weitere Analysen verfügbar zu machen. Eine solche Automatisierung ersetzt zwar nicht die menschliche Arbeitskraft, ermöglicht aber Projekte, die aufgrund ihres Umfangs vorher nicht durchführbar gewesen wären.

Personalisierung wiederum ermöglicht es der KI, das Nutzer:innenverhalten auf einer Plattform zu imitieren. Dies kann zu einem besseren Verständnis der Funktionsweise von Empfehlungsalgorithmen beitragen. Das ermöglicht eine bessere Berichterstattung über die technischen Prozesse in journalistischen Untersuchungen und macht außerdem algorithmische Lösungen für ein breiteres Publikum zugänglicher. Besonders deutlich wird dies in der TikTok-Studie, in der KI-Bots die Interaktionen mit Inhalten zum Thema Essstörungen verfolgten. Anders als bei der traditionellen Datenerfassung durch Hashtags konnten durch den Einsatz von KI auch nicht gekennzeichnete Videos mit relevanten visuellen Inhalten identifiziert werden.

Auch die Reproduzierbarkeit ist ein wichtiger Aspekt der journalistischen Methodik, wenn es um die Recherche auf digitalen Plattformen geht. Die Automatisierung des Prozesses der Datenerfassung und -analyse ermöglicht es Journalist:innen, Experimente mit gleichen Parametern zu wiederholen, was die Zuverlässigkeit ihrer Ergebnisse erhöht. So kann beispielsweise die Analyse der Algorithmen von TikTok zu verschiedenen Zeitpunkten wiederholt werden, um Veränderungen im Empfehlungssystem zu verfolgen. Dies ist besonders wichtig, da Plattformen Einzelfälle leicht als Zufälle erklären können.

Während große Technologieunternehmen die Kontrolle über den Informationsraum verschärfen, können Journalist:innen KI zu ihrem Vorteil nutzen. Die Technologien können dabei unterstützen, riesige Datenmengen zu analysieren, algorithmische Verzerrungen zu erkennen und die Auswirkungen digitaler Technologien auf die Gesellschaft zu untersuchen. So haben investigative Journalist:innen in der neuen technologischen Landschaft nicht nur Platz, sondern spielen eine entscheidende Rolle bei der Gewährleistung der Transparenz digitaler Giganten.

Dieser Artikel erschien zunächst auf der ukrainischen EJO-Seite. Übersetzt von Judith Odenthal mithilfe von DeepL

Die auf dieser Website geäußerten Ansichten sind die der Autoren und spiegeln nicht unbedingt die Ansichten, Strategien und Positionen von EJO wider.

Schlagwörter:, , ,

Kommentare sind geschlossen.

Send this to a friend