Skip to content
Gallery
Datenschutz Web-Browsing
Share
Explore
Wir alle im Web

icon picker
Ach, wie gut, dass jeder weiß ...

Ableitungen aus Daten, Genauigkeit, Intransparenz der Ableitungen
Bearbeitungszeit: ungefähr 26 Minuten

Einleitung

Im letzten Artikel hast du das Vorkommen von Third-Party-Sites auf First-Party-Sites gesehen. Daran hast du erkannt, wie weit Werbenetzwerke im Web verbreitet sind. Du hast gesehen, wie personalisierte Werbung sich an deine Interessen anpassen kann. Werbenetzwerken ist das Thema einer Website bekannt. Wenn du eine Website besuchst, werden die Seitenbesuche und Suchanfragen gespeichert und dein Werbeprofil um diese Interessen erweitert. Das ganze Thema Werbung sollte zum übergeordneten Thema Datenschutz beim Web-Browsing hinführen. Werbung ist das größte und wichtigste Thema des Datenschutzes beim Web-Browsing.
„Bleib mal locker, es ist doch nur Werbung“
Eine Erklärung, warum Werbung so schlimm sein soll, bin ich dir noch schuldig. Da du dich für diesen Datenschutz-Kurs entschieden hast, bin ich sicher, dass du die Aussage oben zumindest anzweifelst. Und falls nicht, ist es vollkommen verständlich, Werbung und Datenschutz nicht sofort einander zuordnen zu können. Es ist ja nicht so, dass man stets und ständig daran erinnert wird. Aber ich habe dir versprochen, Datenschutz verständlich zu erklären und genau deshalb geht es weiter um Werbung, also bleib dran. Ich kläre alles bis zum Ende der Serie auf.
Loading…

Wie viele Klicks setzt du?

Bisher ging es um die Werbenetzwerke und ihre Werbeanzeigen, die sich an deine Interessen anpassen. In diesem Artikel möchte ich dir zeigen, was sie wissen. Warum ist das wichtig? Datenschutz ist eine Entscheidung. Er passiert nicht nebenbei, sonst würde es ja jede_r machen. Und na klar, ich erwische mich auch manchmal dabei, Datenschutz für Bequemlichkeit zu opfern. Wir würden durchdrehen, wenn wir alle Konsequenzen lausigen Datenschutzes immer abwägen würden. Aber darum geht es: Datenschutz ist eine Abwägung. Wir leben in einer kompetitiven, zeitknappen Welt. Es kann daher Nachteile bedeuten, bestimmte Web-Dienste wegen des Datenschutzes nicht zu nutzen. Vieles kann man allerdings kontrollieren: Es gibt mehr Optionen zwischen „keine Privatsphäre“ und „Internet ausschalten“. Um eine solche Abwägung zu treffen, ist es sinnvoll zu wissen, was der Preis für Bequemlichkeit sein kann.
Zentral beim Datenschutz ist, zu verstehen:
Was sagen Daten über mich aus? Was kann damit schlimmstenfalls passieren? Wann sollte ich sie schützen?
Bei personalisierter Werbung sind die Daten Seitenaufrufe und Suchanfragen, aber auch andere Daten wie Likes oder Tweets. Dass man daraus Interessen ableiten kann, für diesen Gedanken hättest du mich nicht gebraucht. Ich möchte dir in diesem Artikel die eigentlichen Probleme zeigen: Es geht um die Genauigkeit, mit der Interessen erfasst werden und um die Folgerungen daraus. Ich will dir zeigen, was andere über dich wissen können. Im folgenden Experiment beginnen wir mit dem Offensichtlichen und graben dann tiefer.
Loading…

Experiment: Abgeleitete Interessen aufdecken

Ziel: Welche Websites du wie oft besucht hast, gibt Hinweise über deine Interessen. Jede Website hat ein Thema. Dieses Experiment zeigt dir ein Interessensprofil aus deinen besuchten Websites.
Das Experiment läuft nur auf Windows-PCs. Bitte melde dich bei mir, damit ich dir Fernzugriff auf einen virtuellen Computer oder eine Demonstration geben kann.
Methode: Der Firefox Portable aus dem letzten Artikel hat ein zweites Add-On installiert. Dieses kann die „Themen“ von Websites auslesen.
Experiment durchführen:
Öffne Firefox Portable.
Rechts neben der Adressleiste ist ein rotes, kreisförmiges Symbol.
Klicke auf das Symbol.
Ein Menü erscheint. Am unteren Rand des Menüs ist ein Button „Open Tracking Transparency Dashboard“.
Klicke auf den Button.
Ein neuer Tab öffnet sich. Du siehst das Tracking Transparency Dashboard. Im Kopfbereich des Dashboards siehst du Dashboard-Ansichten.
Im Kopfbereich des Dashboards klicke auf „Interests”.
Du wechselst zur Interessen-Ansicht. Du siehst ein Kreisdiagramm. Jeder Sektor im Kreisdiagramm ist ein automatisch erkanntes Website-Thema. Je größer ein Sektor, desto öfter hast du Sites mit diesem Thema besucht. Daraus wird geschlossen, dass du dich sehr für dieses Thema interessierst.
Fahre mit der Maus über einen Sektor.
Das Website-Thema erscheint in der Mitte des Kreisdiagramms.
Erkunde das Dashboard und die verschiedenen Ansichten deiner Interessen.
Das Experiment ist beendet. Im nächsten Abschnitt besprechen wir die Ergebnisse.
Du kannst Firefox Portable schließen und löschen.
Firefox Portable löschen
Schließe Firefox Portable.
In Windows Explorer (Dateimanager) suche den entpackten Ordner, aus dem du Firefox Portable gestartet hast.
Lösche den gesamten Ordner.
Du hast Firefox Portable restlos von deinem Computer entfernt.

„Es sind doch nur meine Interessen“

In diesem Experiment hast du gesehen, wie aus Themen besuchter Websites deine Interessen abgeleitet wurden. Dies nennt man Folgerung oder Inferenz. Zugegeben, das Ergebnis ist nicht sehr beeindruckend: Es wurde lediglich gezählt, welche Sites du wie oft besucht hast. Alle Sites wurden automatisch in eine Kategorie eingeordnet. Außerdem war dein Interessen-Profil noch recht übersichtlich, weil du wenige Websites mit diesem Browser besucht hast. Und auch die Kategorien haben wenig Aussagekraft, ich weiß.
Was wäre jedoch, wenn dieses Add-On in dem Browser installiert wäre, den du hauptsächlich benutzt? Mit diesem Browser hättest du tausende Websites aufgerufen. Welches Interessen-Profil würde sich dann ergeben? Das Add-On hätte viel mehr Daten als das Experiment oben. Wahrscheinlich wäre die Folgerung deiner Interessen sehr viel genauer. Die Menge der Daten bestimmt, wie genau Folgerungen sein können. Wie du vorher sehen konntest, haben Werbenetzwerke die Möglichkeit sehr viele Daten zu sammeln. Das Add-On wurde außerdem von einem kleinen Forschungsteam entwickelt, aber welche Werkzeuge haben wohl Werbenetzwerke? Die Menge der Daten sowie die verwendeten Werkzeuge beeinflussen die Genauigkeit der Folgerungen.
Loading…
Lass mich für die Genauigkeit der Folgerungen ein Beispiel geben: Nehmen wir an, dass ein Werbenetzwerk sehr viele Seitenaufrufe von dir gespeichert hat. Das Werbenetzwerk zählt jetzt nicht mehr nur, welche Websites du aufgerufen hast, sondern welche Inhalte du angesehen hast. Das lässt sich beispielsweise daran ablesen, welche untergeordneten Webseiten du auf einer Website aufgerufen hast. Welche Interessen könnte man nun folgern? Sieh dir die folgenden Beispiele an: Es wird ein Interesse aus dem Interessen-Dashboard angegeben. Danach wird eine Folgerung auf Basis der Inhalte angegeben.
Dein Interesse ist „Ernährung“, weil du viele Kochrezepte gesucht hast.
Du öffnest häufig Rezepte mit viel Zucker und Fett? Du magst wohl Süßes und hast eine ungesunde Ernährung.
Dein Interesse sind Video-Plattformen, weil du oft auf YouTube warst. Man könnte aus YouTube-Videos spezielle Interessen ablesen, indem die Titel und Beschreibungen betrachtet werden.
Du guckst viele Videos mit einer politischen Partei im Titel? Wahrscheinlich interessierst du dich für deren Themen. Du bist sicher deren Wähler_in.
Siehst du, was mit den Interessen gemacht wurde? Denke darüber nach. Danach klappe auf.
Aufklappen
Die Interessen wurden spezialisiert:
Aus „Aufruf von Websites mit Videos“ wurden „Videos mit bestimmten Themen“.
Aus „Aufruf von Ernährungs-Sites“ wurden „Rezepte mit ungesunden/gesunden Zutaten“.
Danach wurden aus den speziellen Interessen Persönlichkeitsmerkmale abgeleitet. Je spezieller die Themen der Web-Inhalte wurden, desto genauer konnten Aussagen über dich getroffen werden.
Loading…
Fallen dir noch weitere Elemente von Webseiten ein? Solche von denen man ganz einfach deine Interessen ablesen kann, indem man ihren Namen nachschlägt und ihre Vorkommen zählt? Denke darüber nach. Im Aufklappabschnitt habe ich meine Ideen aufgeschrieben.
Aufklappen
Aus „Aufruf von Gesundheits-Beratungsportalen“ werden „mögliche Krankheiten“.
Aus „Aufruf von Branchenverzeichnissen für Öffnungszeiten“ werden „Mögliche (regelmäßige) Aufenthaltsorte“.

Wir bestimmen, was wir über dich wissen

Oben hast du gesehen, was spezielle Interessen über persönliche Eigenschaften aussagen können – nur durch Ablesen, ohne Magie. Was ich dir hier erzähle ist nichts Neues und nichts Besonderes: Was ich aufrufe, interessiert mich – dieser Zusammenhang ist einfach. Wenn ich also Inhalte aufrufe, wissen Werbenetzwerke, wofür ich mich interessiere. Das wurde in den letzten zwei Artikeln erklärt und ist dir längst bewusst. Hier möchte ich neue Gedanken anknüpfen: Es geht um die Genauigkeit, die Qualität der Interessen – Wie genau können meine Interessen abgelesen werden und was sagen sie über mich aus? Die Genauigkeit kann beliebig gesteigert werden. Die folgenden drei Diagramme visualisieren das. Das Interesse „Video“ wird immer weiter aufgefächert, bis sich aus den Interessen sogar ein politisches Profil ergeben kann.
Diagramme
Interessen (grob)
3
Interessen (mittel)
3
Interessen (speziell)
3

Es sind also „nicht nur deine Interessen“. Es sind auch Eigenschaften, die daraus abgeleitet werden. Über das Thema einer Website oder deren Inhalte sowie der Anzahl, wie oft du sie aufrufst, kann man sehr genau ablesen, wer du bist und was du über bestimmte Dinge denkst. Werbenetzwerken ist das auch möglich. Erinnere dich an den Cookie, die Treuekarte. Werbenetzwerke erkennen dich beim Web-Browsing mit dem Cookie wieder. Sie können alle Seitenbesuche und Suchanfragen für diesen Identifikator speichern. Im Vergleich mit dem Browser-Add-On des Experiments haben sie sehr viel mehr Daten, um Interessen abzuleiten. Welche Themen und Interessen sie verarbeiten und wie speziell diese sind, wissen nur Werbenetzwerke.
Loading…
Daten immer tiefer zu untersuchen und immer tiefere Zusammenhänge herzustellen, kann man sehr weit treiben. Du verdienst es zu wissen, was mit deinen Daten passieren kann. Nur so kannst du dich für oder gegen Datenschutz entscheiden. In einem zweiten Experiment möchte ich dir zeigen, was mit fortgeschrittenen Techniken möglich ist: Das folgende Experiment kann Geschlecht und Alter und Persönlichkeitsprofile nach dem psychologischen vorhersagen. Das Experiment berechnet dies aus Wörtern, die einen Bezug zu dir haben. Du kannst die Wörter automatisch aus einem Social-Media-Profil laden oder eigene Wörter eingeben. Dieses Beispiel entfernt sich ein wenig vom Web-Browsing, da Social-Media im Spiel ist. Das Prinzip bleibt jedoch gleich. Es geht darum, was sich aus einfachen Daten schließen lässt.

Experiment: Persönlichkeitsprofil erstellen lassen

Ziel: Aus Wörtern, die einen Bezug zu dir haben, lässt sich ein Big-Five-Persönlichkeitsprofil erstellen. Dieses Experiment kann ein solches Persönlichkeitsprofil erstellen.
Methode: Du benutzt eine Persönlichkeitsvorhersage, die aus Wörtern oder Social-Media-Posts ein Persönlichkeitsprofil erstellt. Das Werkzeug wurde von der Universität Cambridge produziert. Ergebnisse der Persönlichkeitsvorhersage werden nicht gespeichert. Nur freiwillig eingegebene Daten werden verarbeitet. Die Verarbeitung ist ausschließlich für die Forschung bestimmt. Die Daten können jederzeit gelöscht werden.
Experiment durchführen:
Öffne die Webseite (Link unten) in einem Browser
Im unteren Bereich der Webseite siehst du eine Abbildung. In der linken Spalte stehen Datenquellen. In der mittleren Spalte stehen Daten, die bereit für die Berechnung sind.
In der linken Spalte der Abbildung gib Daten an. Du kannst Social-Media-Profile hinzufügen (empfohlen) oder englischen Freitext angeben. Du kannst eine oder mehrere Optionen wählen:
Social Media-Beispiel Twitter (empfohlen)
In der mittleren Reihe der Abbildung klicke auf den Button „Log in with Twitter“.
Eine Login-Seite von Twitter wird geöffnet.
Gib deine Login-Daten ein.
Klicke auf den Button „Authorize App“.
Du kehrst zur Vorhersage-Seite zurück. In der mittleren Reihe in der mittleren Spalte steht, wie viele Tweets geladen wurden.
Optional: Füge weitere Daten über andere Optionen hinzu.
In der rechten Spalte der Abbildung klicke auf den Button „Make Prediction“.
Ergebnis: siehe Schritt 3 unten (Ergebnis).
Social-Media-Beispiel Facebook
Rufe deine Facebook-Einstellungen auf (Link unten).
Im Listeneintrag „Deine Informationen herunterladen“ klicke auf „Ansehen“.
Du siehst ein Menü mit zwei Reitern, drei Auswahlfeldern und einer Liste. In diesem Menü kannst du auswählen, welche Daten du von Facebook herunterladen willst.
Im Auswahlfeld „Format“ wähle „JSON“ aus.
Im Auswahlfeld „Medienqualität“ wähle „Niedrig“ aus.
In der Liste unter den Auswahlfeldern wähle oben rechts „Auswahl aufheben“ aus.
Alle Markierungen in der Liste werden aufgehoben.
In der Liste wähle die drei Einträge aus: „Beiträge“, „Kommentare“ und „Gefällt mir-Angaben und Reaktionen“.
Rechts neben den Auswahlfeldern klicke auf den Button „Datei erstellen“.
Ein Hinweis erscheint. Die Erstellung wurde gestartet. Du erhältst eine E-Mail, die die Erstellung bestätigt. Die Erstellung dauert etwa fünf Minuten. Wenn die Erstellung abgeschlossen ist, bekommst du eine weitere E-Mail. Verlasse die aktuelle Seite nicht.
Wenn deine Datei erstellt wurde, klicke über den Auswahlfeldern auf den Reiter „Verfügbare Kopien“.
Du siehst alle Kopien, die jemals von deinen Facebook-Daten erstellt wurden.
Bei der neuesten Kopie klicke auf den Button „Herunterladen“.
Speichere die Datei auf deinem Computer.
Wechsle zur Website mit der Persönlichkeitsvorhersage.
In der linken Spalte der Abbildung klicke auf den Button „Upload Facebook Data“.
Wähle deine heruntergeladenen Facebook-Daten aus.
Optional: Füge weitere Daten über andere Optionen hinzu.
In der rechten Spalte der Abbildung klicke auf den Button „Make Prediction“.
Ergebnis: siehe Schritt 3 unten (Ergebnis).
Freitext
Im unteren Bereich der Abbildung im Textfeld gib englische Wörter ein, die einen Bezug zu dir haben.
Wörter nicht mit Komma trennen
gib auch Adjektive, Marken und Produktnamen an
Beispiel: die wichtigsten Objekte in deinem Zimmer
Optional: Füge weitere Daten über andere Optionen hinzu.
In der rechten Spalte der Abbildung klicke auf den Button „Make Prediction“.
Ergebnis: siehe Schritt 3 unten (Ergebnis).
Ergebnis
Eine Webseite wird geöffnet. Dort stehen Hinweise dazu, wie du deine Vorhersageergebnisse speichern kannst.
Klicke auf den Button „Show me my results“.
Die Ergebnis-Webseite öffnet sich. Die Webseite zeigt Folgendes:
Oben: berechnetes Alter und berechnetes Geschlecht
Mitte: Ausprägungen auf den Persönlichkeits-Skalen und Erläuterungen dazu
Unten links: berechnetes Potenzial, eine gute Führungskraft zu sein
Unten rechts: berechneter , der in der Arbeitswelt verbreitet ist.
Falls du Facebook-Daten oder mehrere Quellen verwendet hast: Im oberen Bereich der Webseite stehen Reiter für jede Datenquelle. Klicke auf einen Reiter, um die Persönlichkeitsvorhersage für eine andere Quelle anzusehen. Möglicherweise wurden für verschiedene Daten andere Persönlichkeitsprofile vorhergesagt.
Das Experiment ist beendet.

„Wie immer sehr zuvorkommend von Ihnen“

Aus ein paar Wörtern wie beispielsweise aus Suchanfragen oder Social-Media-Posts wurde ein Persönlichkeitsprofil. Wusstest du, dass solche Folgerungen auf dieser Ebene möglich sind? Vergleiche die Experimentergebnisse – eine Persönlichkeitsvorhersage und ein Interessenprofil. Die Ergebnisse unterscheiden sich in ihrer Aussage über dich. Was ist der Unterschied? Denke kurz darüber nach. Danach klappe auf.
Aufklappen
Deine Interessen sagen etwas über dein Verhältnis zu anderen Dingen im Web oder in der natürlichen Welt aus: Was du gern isst, ob du politisch bist und so weiter. Einige Sachen davon teilst du freiwillig mit Freunden auf Social Media und einige möchtest du geheim halten. Die Interessen sind jedoch relativ eng mit deinen Handlungen verbunden: Es ist wahrscheinlich, dass du dich für das interessierst, was du oft anklickst. Wie du oben gesehen hast, können aus den Interessen auch andere Eigenschaften abgeleitet werden.
Die Persönlichkeitsvorhersage erfasst deine Persönlichkeit. Dies sind grundlegende Eigenschaften, die eigentlich nur im tieferen Austausch mit anderen Menschen hervortreten. Sie lassen sich schwer ändern und beeinflussen lebenslang Handlungen auf einer tieferen Ebene. Die Vorhersage funktioniert so: Die Erstellenden der Vorhersage haben von Freiwilligen Social-Media-Profile und ausgefüllte Persönlichkeitstests bekommen. Mit
@Big-Data
-Methoden konnten Erstellenden Wörter und Persönlichkeitseigenschaften einander zuordnen. Daraus ist ein Vorhersagemodell entstanden. Deine Wörter wurden mit dem Modell verglichen. Aufgrund deiner eingegebenen Wörter wurden dir Persönlichkeitseigenschaften ausgegeben, die bei der Modellerstellung ebenfalls von Leuten angegeben wurden, die diese Wörter verwendet haben. Es wird also angenommen, dass du den Leuten ähnlich bist, die dieselben Wörter verwendet haben.
Der Unterschied zwischen den Ergebnissen ist, wie tief sie dich beschreiben können. Dein Interessenprofil bildet dein Verhältnis zu Themen, Produkten und Personen ab. Deine Persönlichkeitsvorhersage bildet Merkmale deines Charakters ab und sagt voraus, wie du in bestimmten Situationen handeln wirst.

Loading…
Ich zeige dir diese Dinge nicht, um dir Angst zu machen. Es geht mir darum, dass du eine für dich passende Entscheidung triffst, ob und wie du Datenschutz betreibst. Es geht um dich. Für diese Entscheidung zeige ich dir, was es gegeneinander abzuwägen gilt: Beim Datenschutz reden alle von „Daten“, aber selten erklären sie, was damit gemeint ist. Es sind nicht nur die Klicks, Suchen und Likes. Es sind die Folgerungen daraus, die „Daten“ riskant und schützenswert machen. Wie du oben gesehen hast, können aus einfachen „Daten“ (Aufrufe, Posts, Suchen) sehr persönliche Informationen über dich abgleitet werden. Die Genauigkeit/Tiefe ist entscheidend. Berücksichtige daher bei der Abwägung: Es geht nicht nur darum, was du magst – was schon viel aussagt – sondern auch wer du bist. Das ist mit „Daten“ beim Datenschutz gemeint.
Kanntest du die Persönlichkeitsvorhersage und die dort gezeigten Kategorien schon vorher? Ich kannte die Kategorien vor der Vorhersage noch nicht. Wahrscheinlich wissen viele Menschen nicht, wie ihre Persönlichkeit beschaffen ist. Egal, ob deine Vorhersage stimmte oder nicht, problematisch ist hier: In der Vorhersage wurden Kategorien meiner Persönlichkeit aufgedeckt, von denen ich weder wusste, was sie bedeuten, noch welche Werte ich in solchen Vorhersagen erreiche. Third-Party-Sites einschließlich Werbenetzwerke können solche Auswertungen ebenfalls durchführen. Es besteht also die Möglichkeit, dass Werbenetzwerke mehr über dich wissen als du selbst. Erinnere dich an das Interessen-Dashboard und das YouTube-Beispiel: Die Art und Feinheit der Interessen oder Kategorien bestimmen die Werbenetzwerke. Bei der Persönlichkeitsvorhersage verhält sich dies ähnlich.
Die beiden Experimente sollten zeigen, was möglich ist. Denk darüber nach: Ist es richtig, dass andere so viel über dich wissen? Ist es richtig, dass andere mehr über dich wissen als du? Kannst du dir Situationen vorstellen, in denen es gefährlich sein kann, wenn andere das alles und auch noch mehr als du selbst über dich wissen? Darum geht es im nächsten Artikel.
Loading…

Zusammenfassung

Das war ganz schön viel Erklärung für einen Artikel. Ich wollte dir helfen, eigene und begründete Datenschutz-Abwägungen treffen zu können. Dafür habe ich dir gezeigt, was aus Web-Daten gefolgert werden kann. Daran hast du gesehen, was der Preis ist, wenn du dich gegen Datenschutz entscheidest. Hier noch einmal die wichtigsten Inhalte:
Datenschutz ist eine Abwägung.
Third-Party-Sites wissen, welche First-Party-Sites du besuchst.
Third-Party-Sites kennen das Thema einer Website sowie das Thema von Inhalten, beispielsweise durch Titel und Beschreibungen.
Aus Web-Daten (Seitenaufrufe, Suchanfragen, Social-Media-Posts etc.) können persönliche Eigenschaften gefolgert werden:
Aus der Anzahl besuchter Websites kann ein Interessenprofil erstellt werden.
Aus Suchanfragen und Social-Media-Posts können Persönlichkeitsprofile erstellt werden.
Die Genauigkeit des Profils kann beliebig gesteigert werden. Weitere Folgerungen sind möglich.
Werbenetzwerke haben sowohl die Daten als auch die Möglichkeit, persönliche Eigenschaften zu folgern.
Es kann sein, dass Werbenetzwerke mehr über dich wissen, als du über dich weißt.

Im nächsten Artikel möchte ich alles aus den vorherigen Artikeln zusammenführen und dir endlich die Frage beantworten:
Warum ist das so schlimm? Es ist doch nur Werbung.
Und falls du bis hier gelesen hast: Sei stolz auf dich! Datenschutz erledigt sich nicht von allein. Man muss sich kümmern. Weiter so, du bist gut dabei! Wenn du willst, kannst du ein Bonus-Experiment machen. Ansonsten sehen wir uns im nächsten Artikel.

Bonus-Inhalt: Inferenz von Finanz- und Gesundheitsrisiken aus Beispieldaten

Unten ist die Website eines fiktiven Unternehmens verlinkt. Sie wurde von deutschen und französischen, öffentlich-rechtlichen Medienanstalten produziert. Die Webseite dient zur Verdeutlichung von Vorhersagen und Folgerungen aus Daten. Es ist ein Beispiel-Profil angegeben, aus dem Finanz- und Gesundheitsdaten gefolgert werden.
Want to print your doc?
This is not the way.
Try clicking the ⋯ next to your doc name or using a keyboard shortcut (
CtrlP
) instead.