Die Telekom hat dem Robert-Koch-Institut Daten zur Verfügung gestellt, um die Verbreitung des Coronavirus besser zu verstehen. Doch so anonym wie gedacht, sind diese Daten möglicherweise nicht.
Die Telekom-Daten sind anonymisiert und umfassen nur einen Teil-Datensatz. Das klingt tröstlich und harmlos, ist es aber nicht. Ein britisch-belgisches Forscherteam veröffentlichte 2019 in der angesehenen Fachzeitschrift „Nature“ eine Studie, in der sie am Beispiel eines Datensatzes einer Krankenkasse, den sie anonymisiert verkauft hatte, zeigte, dass mit weiteren enthaltenen Daten die Personen relativ einfach wieder identifizierbar waren. 15 demographische Merkmale genügten, damit 99,98% korrekt wiedererkannt wurden. Sie folgerten, dass damit selbst stark gesampelte anonymisierte Datensätze Datenschutzansprüchen und damit dem Wunsch nach einer gesicherten Privatsphäre nicht entsprechen.
Das RKI hat zwar offensichtlich (noch) keinen Plan, wie es die Daten verwenden will. Und noch wird in Deutschland nicht wie in Österreich mittels Standortdaten offiziell kontrolliert, ob Menschen wirklich nicht ausgehen. Aber auch wir müssen uns vor der „Versicherheitlichungs“-Falle in Acht nehmen und nicht aus Angst (vor Einbrüchen, Kriminalität, Drogendealern, Terror, und nun: vor Viren) nach Experimenten mit Verhaltensscannern wie am Bahnhof in Mannheim weitere Verhaltensüberwachungen akzeptieren, die die Kassen Dritter füllen und uns einen Teil unseres Privatlebens kosten.
Einsicht und Nachdenken sind die wirksamstem Krisenbewältigungsmittel demokratischer Gesellschaften. Und Wachsamkeit. Die aktuelle Corona-Krise bestätigt dies. Politiker dürfen auch in Krisenzeiten das Zepter nicht Virologen oder Mobilfunkanbietern überlassen, wie man derzeit zuweilen befürchten muss. Journalistinnen und Journalisten müssen auch und gerade im Krisenfall ihre Kritik- und Kontrollfunktion weiterhin wahrnehmen. Und sie müssen endlich konsequent Daten- und Digitalthemen als Querschnittsthemen behandeln, die rasch relevant für alle sind. Die Datenspende ist ein Beispiel, weil über sie vergleichsweise wenig und nur selten im Kontext berichtet wurde.
Rocher, Luc; Hendrickx, Julien, de Montiove, Yves-Alexandre: Estimating the success of re-identifications in incomplete datasets using generative models. In: Nature Communications, volume 10, Article number: 3069 (23-07-2019), https://doi.org/10.1038/s41467-019-10933-3
Erstveröffentlichung: Tagesspiegel vom 22. März 2020
Bildquelle: pixabay.de
Schlagwörter:Coronavirus, Daten, Datenspende, Robert-Koch-Institut, Telekom, Überwachung