taz.de -- Hype um Big Data: Metafehler Mensch

Prism! Big Data! Politik, Geheimdienste und Wirtschaft spähen unsere Daten aus. Das unberechenbare Verhalten des Menschen steht dem entgegen.
Bild: Daten kommen, Daten gehen, und so mancher sammelt eifrig.

Von je einem Ende der Welt flogen sie aufeinander zu und trafen sich in der Mitte. Zeus‘ Adler bestimmten das neue Zentrum der Welt. So entstand dem Mythos zufolge auch die wichtigste Kultstätte der hellenistischen Welt: das Orakel von Delphi.

Enden des Internets sind heute, [1][de:official&client=firefox-a:von ein paar Spaßseiten] abgesehen, nicht bekannt. Auch eine Mitte fehlt. Und doch, so will es der moderne Mythos, sind die Algorithmen eines Datengottes aufgestiegen und haben sich im Zentrum des Netzes getroffen. Es soll alle Eigenschaften besitzen, um die wichtigste Kultstätte der digitalen und nicht-digitalen Welt der näheren Zukunft zu werden: [2][das Orakel von Big Data.]

Krankheitsdiagnosen, Kindererziehung, sich selbst steuernde Autos, Logistikplanung, Verbrechensbekämpfung, Linguistik und Kreditwesen, Psychologie und Steuererhebung – wenn man sich den vielen neuen Berichten, Analysen und Büchern zum Thema ausliefert, gibt es nur wenig, was Big Data bald angeblich nicht vorhersagen kann. Big Data bedeutet: all jene verfügbaren Daten maschinell zu verarbeiten, die bisher wegen ihrer schieren Menge überwiegend unbearbeitet blieben.

“Unternehmen, Regierungen und auch Individuen werden alles, was möglich ist, erfassen, messen und optimieren“, betonen Viktor Mayer-Schönberger und Kenneth Cukier [3][im Magazin Technology Review] und in ihrem Buch „Big Data: A Revolution That Will Transform How We Live, Work, and Think“. Damit bringen sie auf den Punkt, was Unternehmen begeistert und Datenschützer ängstigt. Angst? Ja, erstmal zu Recht: Messen. Erfassen. Optimieren. Alles. Big Data. Wie das klingt. Da erodiert das Private schon beim Zuhören. Schlagworte ermorden die Freiheit. Gemessen und für manipuliert befunden. Big Brother is optimizing you.

Aber wird der Mensch, den sich Programmierer, Datenanalytiker und Hardwareentwickler oft als Dümmsten Anzunehmenden User (DAU) vorstellen, das einfach so über sich ergehen lassen? Viele DAU zwangen zuletzt Microsoft, wieder einen Startbutton ins neue Betriebssystem einzufügen. Nicht etwa, weil man ihn braucht. Sondern weil er immer schon da war.

Lange galt Big Data als Zukunftsvision. Doch die Aktualität liefert schneller: Der US-Geheimdienst NSA hat Daten aus der gesamten vernetzten Welt gefischt. Britische Suchanfragen, deutscher E-Mail-Verkehr, US-Chats, finnische Internettelefonie – alles ist in eine gigantische Rasterfahndung namens „Prism“ der US-Terrorabwehr eingeflossen.

Big Data und „Prism“

Der Geheimdienst sagt, es seien nur Metadaten gesammelt worden. Barack Obama betont, niemand höre Telefonate direkt ab. Die US-Bürgerrechtsorganisation EFF schlägt den Bogen zu Big Data und [4][spottet]: „Sie wissen, dass du die Suizidpräventionshilfe von der Golden Gate Bridge aus angerufen hast, aber sie wissen nicht, was gesprochen wurde.“ Metadaten sagen manchmal genügend aus.

Das Magazin Slate [5][stellt die richtige Frage.] Wenn die NSA beim Auslesen von Facebook-Seiten auch die Freunde einer Zielperson und die Freunde der Freunde einbezieht, um Personenprofile und Verbindungen zu erfassen, dann sind statt einer schnell 226.000 Personen zu untersuchen. 226.000 Personen sind aber nicht einfach 226.000 Datensätze, es sind im schlimmsten Fall 226.000 potenzielle DAU.

Und sonst? Einer der mächtigsten Geheimdienste der Welt übt sich in Big Data. Das Ganze fliegt auf, weil eine einzelne Person nicht mehr mitmachen will. Hier wird deutlich, warum sich Big-Data-Analytiker vor dem menschlichen Faktor fürchten: Der Mensch als Summe seiner Unberechenbarkeit, Launen, Unzuverlässigkeit und Widerspenstigkeit. Freundlicher gesagt: Willkommen seist du, Mensch, mit all deinen Stärken und Schwächen, deinen Eitelkeiten, deinem Misstrauen und deiner radikalen Ichbezogenheit. Aber auch mit deiner Leidenschaft, viele Daten im Netz zu hinterlassen.

Meine Daten, deine Daten

Wir legen Profile auf Facebook, Twitter und Google+ an, posten Statusmeldung um Statusmeldung, suchen mit Google, Yahoo und Bing, kaufen ein bei Ebay und Amazon, machen Online-Banking, speichern unsere Daten in der Cloud, während mit den Eltern geskypt und mit den Kindern gechattet wird.

Sind wir selber schuld, wenn nun all diese Daten auf uns zurückfallen? Mayer-Schönberger und Cukier [6][winken ab: falsche Frage.] Die richtige laute: Wie können Daten helfen, die Welt zu verstehen? Wie nützlich sei doch Google und sein Umgang mit Daten. Lange bevor die Grippe ausbricht, gibt es schon die [7]["Google-Flu-Trends“].

Auch Chris Anderson, ehemaliger Chefredaktion des Magazins Wired, [8][sieht sich Google und Big Data an. Er fragt:] „Was kann die Menschheit von Google lernen?“ Das Netz sei angewandte Mathematik, eine Mischung aus Forschung und Ingenieurswissen, die Genentschlüsselung des Menschen wird hier zur ersten großen Leistung von Big Data. Wir müssten, so Anderson weiter, auch nicht alles messen, erfassen, optimieren – schließlich gelte der Satz des Statistikers George Box: „Alle Modelle sind falsch, aber einige sind nützlich.“ Google-Manager Peter Norvig springt ihm bei und ändert Box‘ Zitat: „Alle Modelle sind falsch, aber ohne sie wird man kaum noch Erfolg haben“.

Was also kann denn der Mensch von Google lernen? Das Big-Data-Prinzip heißt: Korrelation ersetzt Kausalität. In welcher Beziehung X zu Y steht, hat Vorrang vor den Gründen, warum X so ist, wie er ist. Wichtiger als die Wissenschaft vom Leben, die Biologie, ist Bio-Engeneering. Wer braucht ein Studium Generale, wenn es Informatik und Datenverarbeitung doch auch tun? Da lacht sie, die dekontextualisierte, entsozialisierte, unsemantische und an Logik nicht interessierte Welt der reinen Datenanlyse.

Lob des Menschen und seiner Schwächen

Wir kennen Big Data schon länger als es diesen Begriff überhaupt gibt. Wir Deutschen kennen ihn vom Zensus 2011, nach dem plötzlich 1,5 Millionen Bürger fehlten, vom Berliner Großflughafen, der nicht fertig werden will, von Stuttgart 21. Wir Weltbürger verfolgen einen Drohnenkrieg, der trotz Milliarden Dollar und immer neuer Technologie in den Bergen Afghanistans nur selten Erfolg hat.

Genüsslich [9][breiten Mayer-Schönberger und Cukier aus,] wie der Zahlenfetischist Robert McNamara auf solider Datengrundlage den Vietnamkrieg verlor. Realistische Beurteilungen, sagte der damalige US-Verteidigungsminister, seien nur auf der Grundlage verlässlicher Statistiken möglich. Die Datenmengen standen der US-Armee zur Verfügung, es gewann der Vietcong. „Wir lagen falsch, furchtbar falsch“, schrieb McNamara später in seinen Memoiren.

Dana Boyd, [10][Social-Media-Forscherin, meint:]“In unserer Ära sind Daten billig, aber Sinn daraus zu ziehen ist es nicht“. Nur weil große Mengen an Daten verfügbar seien, müssten sie noch lange nicht viel wert sein. Zu viele Daten, fehlerhafte Daten, sinnlose Daten, zu wenige Daten – schön ist die Vorstellung, wie ein US-Geheimdienst versucht mit einer digitalen Übersetzungshilfe die Kommentare im taz.de-Forum zu verstehen.

Menschen machen im Netz Fehler um Fehler. Für Maschinen, die mit Maschinen kommunizieren sollen, um fehlerfrei Metadaten zu messen, zu erfassen und zu optimieren, ist der Mensch ein Metafehler. Das ist gut für uns und schlecht für Big Data. Beim Orakel von Delphi brauchte es noch ein Edikt des Kaisers, um der Wahrsagerei ein Ende zu bereiten. Beim Orakel von Big Data sollte menschliches Alltagsverhalten reichen. Der Rest ist guter Datenschutz.

18 Jun 2013

LINKS

[1] http://www.google.de/search?q=Ende+des+Internets&ie=utf-8&oe=utf-8&aq=t&rls=org.mozilla
[2] http://de.wikipedia.org/wiki/Big_Data
[3] http://www.technologyreview.com/news/514591/the-dictatorship-of-data/
[4] http://www.eff.org/deeplinks/2013/06/why-metadata-matters
[5] http://www.slate.com/articles/technology/technology/2013/06/prism_two_hops_nsa_agents_are_trained_to_target_friends_of_friends_how_many.html
[6] http://www.wired.com/wiredenterprise/2013/03/big-data/
[7] http://www.google.org/flutrends/
[8] http://www.wired.com/science/discoveries/magazine/16-07/pb_theory
[9] http://www.technologyreview.com/news/514591/the-dictatorship-of-data/
[10] http://www.danah.org/papers/talks/2010/WWW2010.html

AUTOREN

Maik Söhler

TAGS

Big Data
Prism
Internet
Daten
Schwerpunkt Überwachung
Zensus
Big Data
Geheimdienst
NSA
London
NSA
Vergessenwerden
Schwerpunkt Meta
Prism
Internet
Prism
Datenkrake
Tracking
Internet
Abhörskandal
re:publica

ARTIKEL ZUM THEMA

Ergebnisse der Volkszählung 2011: Karlsruhe stoppt Löschung der Daten

Viele Kommunen glauben nicht, dass ihre Einwohnerzahl gesunken ist. Diese Ergebnisse des Zensus 2011 werden nun nicht mehr gelöscht.

Anonymität bei Gendatenbanken: Verräterische Verwandschaft

Menschen sind selbst über anonymisierte Genomdaten identifizierbar, zeigen Studien. Schon entfernte Verwandte verraten ganze Stammbäume.

Folgen der NSA-Enthüllungen: Am idealen Gefängnis bauen

Die Botschaft ist eindeutig: Die Geheimdienste wissen alles. Aber was folgt daraus für die Überwachten – Durchschnittsbürger wie Terroristen?

Überwachung und Individuum: Misstrau mir!

Die NSA-Spähaffäre hat gezeigt, wie der Staat die Kommunikation seiner Bürger überwacht. Was macht diese Verdachtskultur mit unserer Psyche?

Datensammelei in London: Wenn der Mülleimer trackt

200 digitale Mülleimer der Firma Renew sammeln derzeit in London Smartphonedaten von Passanten – und zeigen dann personalisierte Werbung. Nun reagieren die Behörden.

Hype um Big Data: Big Brothers große Schwester

Die Stasi wollte noch jedes Individuum „kennenlernen“. Heutige Geheimdienste machen sich diese Mühe nicht mehr: Sie glauben „Big Data“ sei die Lösung.

EuGH-Anhörung zu Suchmaschine: Kein „Recht auf Vergessenwerden“

Google kann nicht gezwungen werden Informationen zu löschen, meint der Generalanwalt des EU-Gerichtshofes. In einem anderen Punkt aber hatte der Konzern keinen Erfolg.

Datenpanne bei Facebook: Millionen Privatdaten weitergegeben

Private Informationen von fast 6 Millionen Facebook-Nutzern waren ein Jahr lang herunterladbar. Der Fehler ist nun behoben, Betroffene werden per Mail informiert.

Druck auf Google nach Prism-Skandal: Nun droht der Lizenzentzug

Nach Prism wollen europäische Datenschützer Google zu einem sensibleren Umgang mit Daten zwingen. Es hilft aber nur ein europaweites Gesetz.

Online-Lesegewohnheiten: Klick – und weg bist du

Die Aufmerksamkeitsspanne der Leser von Internetmedien ist sehr kurz, bei mobilen Angeboten noch kürzer. Was bedeutet das für Journalisten und Verlage?

Obama verteidigt Spähprogramm Prism: Kontrolle durch Geheimgericht

Die Bürgerrechte werden gewahrt, versichert der US-Präsident in einem Interview. Kontrolliert werde das von einem geheimen Gremium mit geheimen Mitgliedern.

Überwachung im Netz: Die Furcht vor Kontrollverlust

Kaum passiert etwas Negatives wie der „Prism“-Skandal in den USA, und schon wird das Internet an sich verunglimpft. Das ist ziemlich kurzsichtig.

Schutz gegen Tracking: Spione kommen hier nicht rein

Werbedienste sammeln heimlich Daten über unser Surfverhalten. Die Tracking Protection List des Fraunhofer-Instituts kappt die Verbindung zu den Schnüffel-Websites.

Netzüberwachung durch die NSA: Die Bundesregierung weiß von nichts

Die Debatte über eine weitreichende Netz-Überwachung in den USA erreicht nun auch die Bundesregierung. Doch die gibt sich bisher ahnungslos.

Bespitzelungsskandal in den USA: NSA bedient sich auch bei Google

Der Abhörskandal in den USA weitet sich aus. Nach Medienberichten soll der Geheimdienst NSA auch Zugang zu Kundendaten von Apple und Google haben.

Netzkonferenz „re:publica“, 2. Tag: Von Schweißen bis Antarktis

Die Klassifikation der LOLCat-Lover, bratwurstessende Politiker und das Ende der Arbeit: der zweite Tag der Internetkonferenz „re:publica“.