Datenauswertung mit Big Data

Wie ein Verbrechen genauer vorhergesagt wird als das Wetter

Die Digitalisierung von immer mehr Lebensbereichen führt zu einem so noch nie da gewesenen Datenaufkommen. Telekommunikation, Finanzwesen, Energie, Verkehr, Gesundheitswesen, Surfen, Chatten oder Fernsehen erzeugen immer mehr Datenspuren. Damit lässt sich unter anderem auch menschliches Verhalten vorhersagen – ein Problem für Datenschützer.

Mit Big Data bezeichnet man die Zusammenführung und Auswertung großer Datenmengen aus vielen, ganz unterschiedlichen Quellen. Dabei ist die Speicherung der Daten alleine nicht das Problem. Die technischen Möglichkeiten erlauben es mittlerweile, diese immensen Datenmengen zusammenzuführen, auszuwerten, zu analysieren, zu visualisieren und verborgene Zusammenhänge aufzuzeigen – und dies in immer kürzerer Zeit, je leistungsfähiger die Geräte werden.

Diese technischen Möglichkeiten sind die Grundlage für spezielle Vorhersagemodelle. Nutzungs- und Standortdaten werden zu Kommunikations-, Konsum-, Verhaltens- und Bewegungsprofilen verdichtet, mit anderen Daten gemischt und erlauben so quasi einen Blick in die Zukunft. Zum Beispiel lassen sie Voraussagen darüber zu, wo sich eine Person zu einem bestimmten Zeitpunkt aufhalten und was sie dann tun wird. Vor einiger Zeit konnte Google allein aufgrund der Suchanfragen in seiner Suchmaschine eine Grippewelle voraussagen. In den USA nutzt die Polizei in einigen Städten sogenannte „Predictive Software“, das heißt ein Programm, das abschätzt, in welchen Stadtteilen zu welcher Tageszeit die größte Wahrscheinlichkeit für Einbrüche oder Diebstähle besteht. Ein Computer-Algorithmus analysiert dafür Daten aus Pendlerströmen, Daten über die Wohngebiete, die dortige Bevölkerungsstruktur und statistische Daten.

Aus Sicht der Datenschützer ist eines der Probleme bei diesem sogenannten „Data Mining“ (engl. für „Daten-Bergbau“), dass es nicht unbedingt darauf ankommt, dass die Daten personenbezogen sind. Durch die Datenmenge, die unterschiedlichen Datenquellen, die Zusammenführung und den Datenabgleich kann ein „scharfes Bild“ entstehen, das leicht einer konkreten Person zugeordnet werden kann, auch, wenn man zunächst keinen Namen oder Wohnort dieser wusste.

So wie der Schufa-Wert darüber entscheidet, ob man einen Kredit bekommt oder einen Handyvertrag, könnte der Wert eines „Social Scorings“ auf Basis von gesammelten Daten eines Tages beeinflussen, ob man eine Einladung zu einem Vorstellungsgespräch erhält oder nicht.

Quelle: Youngdata-Website des Landesbeauftragten für den Datenschutz Rhienland-Pfalz.

Dieser Artikel gibt den Sachstand zum Zeitpunkt der Veröffentlichung wieder. Datum: 29. Juni 2016

Lizenz: Für den Text auf dieser Seite gilt: CC-BY 4.0 International