3.1 Daten überall – Big Data

Stop and Think

Was wissen Sie bereits über Daten, Algorithmen und Künstliche Intelligenz? Welche weiteren Begriffe, die Sie kennen, verbinden Sie damit? In welchem Kontext werden bzw. sind diese für Sie relevant?

Durch die alltägliche Nutzung von Medien werden jeden Tag große Datenmengen produziert. Sei es, wenn wir bspw. bei Google oder einem anderen Anbieter eine Suche eingeben, online über einen Anbieter etwas einkaufen, eine Online-Zeitung lesen oder soziale Netzwerke nutzen, um mit unseren Freund*innen in Kontakt zu treten. Aber auch durch Reisebuchungen, Überwachungskameras oder Kundenkarten entstehen immer größere Datenmengen (vgl. Aust 2021). Die Massen an Daten und die Geschwindigkeit, mit der sie produziert werden, werden als Big Data bezeichnet. In der Literatur wird der Begriff Big Data häufig über die drei Kriterien Volume (Menge von Daten), Velocity (Geschwindigkeit der Erzeugung von Daten) und Variety (Vielfalt von Daten) erklärt (vgl. Aust 2021). Dabei müssen nicht zwangsläufig alle drei Merkmale vorhanden sein, um von Big Data zu sprechen. Auch werden in einigen Definitionen noch andere Merkmale herangezogen.

Eine Statistik, die die pro Jahr erzeugte Datenmenge weltweit darstellt.

Abb. 3.1: Jährlicher Verbrauch produzierter Daten
Quelle: Statista, 2023

Die Verarbeitung dieser großen Datenmengen ist verhältnismäßig aufwendig. Ist die Qualität von Daten schlecht, können diese nicht weiterverwendet werden und müssen aussortiert werden. Auf Grund der Menge und vor allem der Vielfalt der Daten müssen sie in Datenbanken gespeichert werden, die eine entsprechende Leistungsfähigkeit besitzen. All das ist mit hohem Aufwand (u.a. durch den Platz, den große Datenbanken benötigen, und die Kosten, die sie verursachen) verbunden (vgl. Aust 2021). Dennoch haben Unternehmen trotz des erheblichen Aufwandes ein Interesse daran, möglichst viele Daten von Nutzer*innen zu sammeln und zu speichern. In den von Nutzer*innen preisgegebenen Daten stecken für Unternehmen viele wichtige Informationen. Anbieter wie Meta Platforms als Inhaber von Facebook und Instagram, Google usw. sammeln Daten, analysieren und verknüpfen sie und nutzen sie gegebenenfalls zu kommerziellen Zwecken. Aus diesen Daten resultiert ein personalisiertes Produkt, wie bspw. der Facebook Feed oder die TikTok Startseite, das entsprechend der Interessen von Nutzer*innen hergestellt wird. Besonders Social Media wären ohne die Big Data Techniken kaum denkbar. Bei besonders großen und globalen Unternehmen bedarf es hierfür besonders anspruchsvoller Datenverarbeitungstechniken (vgl. Aust 2021).

Auch Cookies sind Daten in Form von kleinen Textdateien, die lokal auf einem Rechner von Benutzer*innen durch das Besuchen einer Internetseite gespeichert werden. Bei einem erneuten Besuch auf einer Webseite werden die Textdateien (Cookies) mittels zufällig generierter Unique-Identifier (kurz IDs genannt) an einen Server gesendet (vgl. Kulyk et al. 2019). So werden Informationen durch einen Webserver auf einem Rechner von Benutzer*innen hinterlegt, wie bspw. Anmeldeinformationen, sodass bei einem erneuten Besuch der Internetseite die Angabe einer Information für eine Anmeldung (bspw. E-Mail-Adresse) übersprungen werden kann. Betreibende von Internetseiten haben durch Cookies die Möglichkeit, Informationen über die Benutzer*innen und das Nutzungsverhalten zu sammeln, um entsprechend bspw. Werbungen auf Nutzer*innen abzustimmen (vgl. Kulyk et al. 2019).

Die Funktionsweisen von Cookies als Kreislauf dargestellt.

Abb. 3.2: Die Funktionsweisen von Cookies.
Quelle: Eigene Darstellung 2024.

Bspw. werden Nutzer*innen bei einer Online-Recherche nach Sportschuhen beim erneuten Aufrufen einer Webseite häufig weitere Angebote zu ähnlichen Sportschuhen angezeigt. Cookies können sowohl von Webseitenbetreibenden als auch von Werbefirmen auf einer Internetseite platziert werden. Dementsprechend unterscheidet man zwei verschiedene Arten von Cookies: Standard Cookies werden lediglich von Internetseitenbetreibenden gesetzt und nur sie können diese auch auslesen. Zusätzlich gibt es auch Drittanbieter Cookies. Jene können seitenübergreifend von Werbetreibenden auf diversen Internetseiten platziert und ausgelesen werden. Dadurch kann ein Unternehmen Cookies von allen Webseiten auslesen, auf denen diese Cookies platziert wurden, um so Nutzungsmuster von Nutzer*innen zu erhalten (vgl. Kulyk et al. 2019).

Wenn Sie sich jetzt fragen, wie Sie herausfinden können, wo und welche Daten von Ihnen gespeichert werden, stellt die Seite Privacy Check eine Suchmaschine vor, die Ihnen dabei hilft, die Nutzung Ihrer Daten nachzuvollziehen (https://www.experte.de/browser-privacy-check ). Das Programm ermittelt Informationen zu Ihrer Verbindung, Ihrem Ort, von Ihnen angeschaute Werbeanzeigen, von Ihnen genutzte Social-Media-Plattformen, Hardware, Software usw. Es analysiert Ihre Internetspuren. Zudem werden dazu jeweils Möglichkeiten aufgezeigt, wie das Tracking – also das Nachverfolgen – der Daten verhindert werden kann. Die ermittelten Daten werden nicht von dem Programm gespeichert (bis auf die Informationen, denen Sie zuvor zugestimmt haben).

Literatur- und Web-Tipps

Eine ähnliche Software wie Privacy Check, mit der man verdeckte Dienste (Übermittlung privater Daten an Seitenbetreibende) einsehen kann, stellt Ghostery dar (https://www.ghostery.com/ ).

Für alle Internetseiten bleibt jedoch zu beachten: Programme ändern sich stetig und Verlinkungen werden neu gesetzt. Entsprechend sei Nutzer*innen geraten, regelmäßig nach aktuellen Programmen/Informationen zu schauen. Für einen sicheren Umgang in der Verwaltung von Cookies können Sie folgende Maßnahmen treffen:

  • Sie können Cookies regelmäßig selbstständig löschen. Dafür gehen Sie in Ihrem Browser am Beispiel vom Firefox Browser auf: »Einstellungen«, »Datenschutz & Sicherheit«, »Cookies und Webseiten-Daten«, »Daten entfernen«. Wenn Sie dann auf »leeren« drücken, haben Sie die gespeicherten Cookies gelöscht.
  • Sie können Cookies bereits vorab verwalten: Gehen Sie dazu erneut auf »Einstellungen«, dann auf »Datenschutz & Sicherheit«, »Cookies und Webseiten-Daten« und betätigen Sie das Häkchen bei »Cookies und Webseiten-Daten beim Beenden von Firefox löschen«. Dann werden Cookies immer automatisch gelöscht, wenn Sie eine Webseite schließen.
  • Zusätzlich können Sie Drittanbieter (seitenübergreifende) Cookies ausstellen: Dazu gehen Sie erneut auf »Einstellungen«, dann auf »Datenschutz & Sicherheit« und unter dem Punkt »Browser-Datenschutz« aktivieren Sie die Einstellung »Benutzerdefiniert« und stellen dabei den Reiter »Cookies zur seitenübergreifenden Aktivitätenverfolgung« ein.
Take Home Messages

Der Begriff Big Data wird häufig verwendet, wenn die Kriterien der

  • Menge an Daten,
  • die Geschwindigkeit, mit der sie produziert werden
  • und eine Vielfalt von Daten vorliegen.

Es gibt Programme, die Ihnen anzeigen, welche Daten Sie bei Ihrer Internetnutzung (potenziell) preisgeben.

Aufgaben

Bearbeiten Sie die folgenden Aufgaben: 

Stop and Think

Reflektieren Sie Ihre eigenen Gedanken und Meinungen zu Big Data: Wie genau beeinflusst Big Data Ihre persönliche oder berufliche Lebenswelt? Welche Chancen und Risiken sehen Sie für sich persönlich?