Logo DJA

Journalismus-Lexikon

Datengetriebener Journalismus (data-driven journalism oder computational journalism)

Datengetriebener Journalismus

Datengetriebener Journalismus (data-driven journalism oder computational journalism), auch bekannt als datengestützter Journalismus oder einfach Datenjournalismus, bezeichnet die zunehmend verbreitete journalistische Praxis, verschiedene rechnergestützte Methoden zu verwenden, um große und komplexe Datensätze – hauptsächlich in Form von Textdokumenten – zu analysieren und die Ergebnisse der Untersuchungen dem Publikum visuell zu präsentieren. Datensätze dienen dabei typischerweise sowohl als Quelle des datengetriebenen Journalismus als auch als Werkzeuge, mit deren Hilfe bestimmte Nachrichten erzählt werden. Diese Form des Journalismus stelle laut ihren Befürwortern einen Fortschritt gegenüber dem konventionellen Journalismus dar. Anstatt lediglich die Perspektiven zweier oder mehrerer Quellen gegenüberzustellen und dem Publikum die Entscheidung zu überlassen, wo die Wahrheit liege, ermögliche es der datengetriebene Journalismus den Journalisten selbst, die Wahrheit zu einer bestimmten Fragestellung zu ermitteln und sie dann dem Publikum mitzuteilen.

Datengetriebener Journalismus werde aus mehreren Gründen immer wichtiger. Der erste Grund habe mit der schieren Menge an Informationen in der heutigen Gesellschaft zu tun. In einem Zeitalter des Informationsüberflusses, in dem das Publikum nahezu unbegrenzten Zugang zu Informationen aus zahlreichen, nicht-journalistischen Quellen habe, liege der Hauptwert des Journalismus in der Analyse und Interpretation des nie endenden Informationsstroms – indem Kontext bereitgestellt, verborgene Muster und Zusammenhänge aufgedeckt und die Ergebnisse der Untersuchungen so dargestellt werden, dass sie für das Publikum interessant und relevant erscheinen. Datengetriebener Journalismus verlagere den Fokus und die Verantwortung des Journalisten somit weg vom reinen Berichten über Ereignisse hin zur Erklärung, was diese Ereignisse bedeuten.

Zweitens – und damit verbunden – befreie der Einsatz bestehender Datensätze Journalisten von der eher einfachen Aufgabe der Informationsbeschaffung und ermögliche es ihnen, sich stattdessen auf die Verifizierung, Erklärung und Kommunikation der Informationen zu konzentrieren. Drittens könne gut gemachter datengetriebener Journalismus zur Förderung der journalistischen Transparenz beitragen und so das öffentliche Vertrauen in den Journalismus und die Nachrichtenmedien im Allgemeinen stärken. Wenn die Datensätze, auf denen ihre Analysen basieren, öffentlich zugänglich gemacht würden, erhielten die Rezipienten die Möglichkeit, die Interpretationen nicht nur zu überprüfen, sondern auch eigene Schlüsse zu ziehen.

Datengetriebener Journalismus könne somit als der Versuch der etablierten Nachrichtenmedien verstanden werden, sich an Veränderungen in ihrem externen Umfeld anzupassen – insbesondere an die regelrechte Explosion verfügbarer Informationen. Dies ermögliche es Journalisten, ihre berufliche Rolle neu zu definieren: weg vom Informationssammler hin zum Informationsverarbeiter und -vermittler – und gleichzeitig werde dem Publikum die Möglichkeit geboten, aktiv am journalistischen Prozess teilzunehmen.

 

Die historischen Wurzeln des datengetriebenen Journalismus

Auch wenn datengetriebener Journalismus eine relativ neue journalistische Erscheinung sei, die auf die Mitte der 2000er-Jahre zurückgehe, habe der Einsatz von Daten im Journalismus eine lange Geschichte. Laut Fachleuten reiche die Praxis, Daten zur journalistischen Berichterstattung zu nutzen, so weit zurück, wie Daten öffentlich verfügbar seien. Ein frühes Beispiel stamme von einer britischen Zeitung, die im Jahr 1821 eine Tabelle mit allen Schulen in Manchester veröffentlichte, in der auch die Anzahl der Schüler und die Kosten pro Schule aufgeführt waren. Diese Tabelle habe zum ersten Mal im Vereinigten Königreich die tatsächliche Zahl der Schüler gezeigt, die kostenlosen Unterricht erhielten – eine Zahl, die weit höher gewesen sei als die offiziellen Angaben.

Ein moderner Vorläufer des heutigen datengetriebenen Journalismus sei das sogenannte „Computer Assisted Reporting“ (CAR), also rechnergestützte Berichterstattung. Dies stelle den ersten systematischen Ansatz dar, Computer zur Sammlung und Analyse von Daten im Journalismus einzusetzen. Zum ersten Mal sei CAR im Jahr 1952 von einem US-Fernsehsender verwendet worden, um den Ausgang der Präsidentschaftswahl zwischen Dwight Eisenhower und Adlai Stevenson vorherzusagen. Seit den 1960er-Jahren hätten viele investigative Journalisten, besonders in den USA, CAR-Techniken genutzt, um vorherrschende Meinungen in Frage zu stellen und Ungerechtigkeiten aufzudecken – sowohl von staatlichen Stellen als auch von privaten Unternehmen.

Beispiele seien u. a. Analysen eines Journalisten zu den sogenannten Detroit Riots in den 1960er-Jahren gewesen, die gezeigt hätten, dass nicht nur bildungsferne Südstaatler an den Unruhen beteiligt gewesen seien; Analysen aus den 1980er-Jahren, die eine systematische rassistische Voreingenommenheit in den Kreditvergaberichtlinien großer US-Finanzinstitute offenbart hätten; sowie Analysen aus den 1990er-Jahren, die untersucht hätten, welchen Einfluss die Schäden durch den Hurrikan Andrew auf die städtebauliche Entwicklung hatten.

Die verschiedenen Techniken der rechnergestützten Berichterstattung seien 1973 in einem Buch zusammengefasst und theoretisch untermauert worden. Der Autor habe darin den Einsatz von Methoden aus den Sozial- und Verhaltenswissenschaften im Journalismus befürwortet. Diese Form des „präzisen Journalismus“ sei auch als Reaktion auf die sogenannte „New Journalism“-Bewegung entstanden, bei der literarische Stilmittel auf den Journalismus angewendet worden seien. Um Objektivität und Wahrheit anzustreben, müsse Journalismus, so die Argumentation, wissenschaftliche Methoden der Datenerhebung und -analyse statt literarischer Techniken anwenden.

Die unmittelbarsten historischen Voraussetzungen für das Entstehen des datengetriebenen Journalismus als journalistisches Konzept seien das exponentielle Wachstum des Online-Zugangs zu öffentlichen Datenbanken, insbesondere durch Open-Government-Initiativen, sowie die Entwicklung leistungsfähiger Softwaretools zur Datenanalyse, -visualisierung und -veröffentlichung. Zudem spiele das gestiegene Interesse des Publikums an der Online-Beteiligung an journalistischen Inhalten eine Rolle, wie etwa an Kommentaren zu Artikeln oder durch eigene politische Blogs.

 

Die Praxis des datengetriebenen Journalismus

Auch wenn kein Projekt im datengetriebenen Journalismus exakt dem anderen gleiche, lasse sich ein typischer Ablauf beschreiben. Im Allgemeinen gebe es zwei Wege, wie Journalisten ein Projekt beginnen könnten: Entweder stelle ein spezifischer Datensatz den Ausgangspunkt für eine Geschichte dar, oder ein Datensatz werde beschafft, um eine bereits bestehende Geschichte weiter zu untermauern. Unabhängig vom Auslöser werde der Datensatz analysiert, basierend auf den Fragen, die im Rahmen der Geschichte beantwortet werden sollen. Dieser Schritt, auch „Data Mining“ genannt, bezeichne den rechnergestützten Prozess des Erkennens von Mustern und Zusammenhängen im Datensatz. Falls notwendig, werde der Datensatz mit weiteren relevanten Datensätzen kombiniert.

Nach Abschluss der Analyse würden typischerweise Datenvisualisierungen erstellt – also grafische Darstellungen der Daten. Ziel dieser Visualisierungen sei es, die in den Daten enthaltenen Informationen möglichst klar und effektiv zu kommunizieren, unter der Annahme, dass das Publikum Muster und Zusammenhänge visuell besser erfassen könne.

Mitunter führten Datenanalysen nicht nur zu Visualisierungen, sondern auch zu dauerhaften Online-Anwendungen. Ein Beispiel sei eine interaktive Datenbank eines gemeinnützigen Nachrichtenunternehmens gewesen, das die Zahlungen von Pharmakonzernen an Ärzte erfasst habe. Die Nutzer konnten dort nach ihren eigenen Ärzten suchen, um herauszufinden, von welchen Unternehmen diese Zahlungen erhalten hatten.

Zudem sei es üblich, die Rohdaten sowie die Ergebnisse der Analyse zusammen mit der Geschichte zu veröffentlichen – entweder gleichzeitig oder nachträglich. Für Nachrichtenorganisationen, die sich dem datengetriebenen Journalismus verschrieben hätten, sei die Veröffentlichung der Rohdaten und Analyseergebnisse ein integraler Bestandteil des Prozesses. Dadurch könnten die Rezipienten eigene Analysen durchführen und die Ergebnisse mit denen der Journalisten vergleichen.

In der Praxis gehöre die Einbindung des Publikums oft ausdrücklich zum Prozess. So habe eine britische Zeitung im Jahr 2009 fast 500.000 Seiten von Abrechnungen britischer Abgeordneter online veröffentlicht und das Publikum aufgefordert, verdächtige Posten zu melden. Innerhalb von 80 Stunden seien fast 170.000 Dokumente von Leserinnen und Lesern geprüft worden.

Zusammenfassend bestehe der Prozess des datengetriebenen Journalismus aus folgenden Schritten: Identifikation des Themas und der möglichen Rolle von Daten, Beschaffung des relevanten Datensatzes, Analyse und ggf. Kombination mit anderen Datensätzen, Erstellung des Endprodukts (Geschichte, Visualisierungen, interaktive Elemente), Veröffentlichung aller Materialien inklusive der Rohdaten und Analyseergebnisse – sowie Einladung an das Publikum, sich an der weiteren Analyse und Interpretation zu beteiligen.

Wie daraus deutlich werde, verlange datengetriebener Journalismus Fähigkeiten, die über die traditionellen journalistischen Kompetenzen wie Recherche, Schreiben und Redigieren hinausgingen. Dazu gehörten Kenntnisse in Grafikdesign, Programmierung, Statistik, Visualisierung und Webentwicklung. Daher seien solche Projekte oft Teamarbeit, bei denen neben Journalisten auch Designer, Programmierer, Statistiker, Visualisierungsexperten und Webentwickler beteiligt seien.

 

Kritik am datengetriebenen Journalismus

Obwohl viele Wissenschaftler und Journalisten die Entwicklung des datengetriebenen Journalismus begrüßten, gebe es auch Kritik. Unter anderem werde behauptet, Datenvisualisierungen würden vor allem erstellt, um andere Journalisten zu beeindrucken; das Publikum interessiere sich nicht wirklich dafür; und sie böten keinen Mehrwert gegenüber dem geschriebenen Text.

Diese Kritik sei laut empirischer Forschung nicht haltbar. Es gebe keine Hinweise darauf, dass Visualisierungen primär oder überhaupt zur Selbstdarstellung gegenüber Kollegen erstellt würden. Vielmehr sei die Motivation von Nachrichtenorganisationen, Ergebnisse ihrer Recherchen möglichst ansprechend und interessant für das Publikum zu präsentieren. Studien hätten gezeigt, dass das Publikum sich stark zu solchen Visualisierungen hingezogen fühle. Vergleiche zeigten, dass Leser deutlich häufiger Inhalte aus dem Bereich des datengetriebenen Journalismus aufriefen als klassische journalistische Formate. Zudem erleichterten Datenvisualisierungen laut Forschung dem Publikum tatsächlich das Erkennen und Verstehen relevanter Muster und Zusammenhänge.

 

Autor: Prof. Dr. Tanni Haas




zurück zum Lexikon
WordPress Cookie Plugin von Real Cookie Banner