Ruprecht-Karls-Universität Heidelberg

Facebook kennt auch die Nicht-Mitglieder

Was können soziale Netzwerke im Internet über Menschen wissen, die selbst kein Nutzerprofil besitzen aber Freunde von Mitgliedern sind? Das haben Forscher des Interdisziplinären Zentrums für Wissenschaftliches Rechnen (IWR) der Universität Heidelberg untersucht. Ihre Arbeiten zeigen, dass sich Informationen aus der Netzwerkstruktur von Mitgliedern auf Nicht-Mitglieder übertragen und mit Hilfe von netzwerkanalytischen Strukturmerkmalen auswerten lassen.

Unter bestimmten Voraussetzungen ist es sogar möglich, etwa 40 Prozent der existierenden Freundschaftsbeziehungen zwischen Nicht-Mitgliedern auf der Basis reiner Kontaktdaten korrekt vorherzusagen. Was deutlich macht, welches Potenzial soziale Netzwerke besitzen, um Informationen über Nicht-Mitglieder abzuleiten. Die Forschungsergebnisse wurden jüngst in „PLoS ONE“ veröffentlicht.

Bereits seit einigen Jahren gehen Wissenschaftler der Frage nach, welche Schlussfolgerungen sich mit Hilfe des Computers aus direkt oder indirekt eingegebenen Daten durch entsprechende Lern- und Vorhersagealgorithmen ziehen lassen. In einem sozialen Netzwerk können auch Angaben wie sexuelle Orientierung oder politische Ausrichtung, die ein Mitglied nicht selbst angegeben hat, mit sehr hoher Präzision berechnet werden, wenn genug Freunde des betreffenden Nutzers die entsprechende Information über sich selbst freigegeben haben. „Sobald bestätigte Freundschaftsbeziehungen bekannt sind, ist die Vorhersage bestimmter unbekannter Eigenschaften keine allzu große Herausforderung mehr für die maschinelle Datenanalyse“, sagt Prof. Dr. Fred Hamprecht, Mitbegründer des Heidelberg Collaboratory for Image Processing (HCI).

Untersuchungen dieser Art beschränkten sich bislang jedoch auf Nutzer von sozialen Netzwerken, also auf Personen, die dort über ein Nutzerprofil verfügen – und damit den jeweiligen Datenschutzbedingungen zugestimmt haben. „Nicht-Mitglieder besitzen hingegen keine derartige Vereinbarung. Aus diesem Grund haben wir ihre Anfälligkeit für die automatische Generierung sogenannter Schattenprofile untersucht“, erläutert Prof. Dr. Katharina Zweig, die bis vor Kurzem am IWR tätig war. Hamprecht und Zweig nutzten die gemeinsame Zeit am universitätsinternen, interdisziplinär ausgerichteten Marsiliuskolleg, um dieser Frage nachzugehen.

Soziale Netzwerke teilen die Gesellschaft in Mitglieder und Nicht-Mitglieder auf. Beziehungen zwischen Nicht-Mitgliedern, deren E-Mail-Adressen dem Netzwerk von Mitgliedern mitgeteilt wurden (rote Verbindungslinien), können anhand der beidseitig bestätigten Freundschaftsbeziehungen zwischen Mitgliedern (schwarze Linien) und ihren Verbindungen zu Nicht-Mitgliedern (grüne Linien) mit großer Wahrscheinlichkeit vorhergesagt werden.
Abbildung: Ágnes Horvát

In einem sozialen Netzwerk ist es möglich, unter anderem mit Hilfe einer Funktion zum Auffinden von Bekannten an Informationen über Nicht-Mitglieder zu gelangen. So werden Neumitglieder von Facebook dazu aufgefordert, bei ihrer Registrierung dem Netzwerk ihre kompletten E-Mail-Kontakte zur Verfügung zu stellen – auch Kontakte zu Personen, die selbst nicht Mitglied bei Facebook sind. „Dieses sehr grundlegende Wissen darüber, wer mit wem in einem sozialen Netzwerk bekannt ist, lässt sich mit Informationen darüber verknüpfen, wen Nutzer außerhalb des Netzwerks kennen. Mit dieser Verknüpfung kann dann wiederum ein wesentlicher Teil des Bekanntschaftnetzes zwischen Nicht-Mitgliedern abgeleitet werden“, erläutert Ágnes Horvát vom IWR.

Für ihre Berechnungen nutzten die Heidelberger Wissenschaftler ein Standard-Verfahren des maschinellen Lernens, aufbauend auf netzwerkanalytischen Strukturmerkmalen. Da die Daten, die für diese Untersuchung benötigt wurden, nicht frei erhältlich sind, arbeiteten die Forscher mit einem Testset echter Grunddaten. Die Aufteilung in Mitglieder und Nicht-Mitglieder sollte dabei mit einer möglichst großen Bandbreite von Methoden simuliert werden; mit der Simulation war es zudem möglich, die Untersuchungsergebnisse zu validieren. Selbst handelsübliche Computer konnten so in nur wenigen Tagen berechnen, welche Nicht-Mitglieder mit großer Wahrscheinlichkeit miteinander befreundet sind.

Für die Forscher war dabei überraschend, dass alle Simulationsansätze qualitativ dasselbe Ergebnis brachten. „Unter realistischen Annahmen darüber, wie viel Prozent einer Bevölkerung Mitglied eines sozialen Netzwerks sind und mit welcher Wahrscheinlichkeit diese ihr E-Mail-Adressbuch hochladen, hat sich gezeigt, dass es mit den Berechnungen möglich war, rund 40 Prozent richtige Vorhersagen über Bekanntschaften zwischen den Nicht-Mitgliedern zu treffen.“ Dies stellt nach Angaben von Dr. Michael Hanselmann vom HCI eine 20-fache Verbesserung gegenüber einfachem Raten dar.

Prof. Hamprecht stellt fest: „Unsere Untersuchung hat deutlich gemacht, welches Potenzial soziale Netzwerke besitzen, um Informationen über Nicht-Mitglieder abzuleiten. Die Resultate sind auch deshalb erstaunlich, weil sie auf reinen Kontaktdaten beruhen.“ Viele Netzwerke und Dienstleister verfügen jedoch über weitaus mehr Informationen der Nutzer, etwa Alter, Einkommen, Ausbildung oder Wohnort. Mit der Verwendung solcher Angaben, einer entsprechenden technischen Infrastruktur und weiteren Strukturmerkmalen der Netzwerkanalyse ließe sich – so die Wissenschaftler – die Vorhersagegenauigkeit vermutlich noch deutlich steigern. „Insgesamt zeigt unser Projekt damit auf“, betont Katharina Zweig, „dass wir als Gesellschaft eine Vereinbarung dafür finden müssen, inwieweit Informationen genutzt werden dürfen, zu denen es keine Freigabe der betroffenen Personen gibt.“

Kontakt:

Prof. Dr. Fred Hamprecht
Interdisziplinäres Zentrum für Wissenschaftliches Rechnen
Telefon: 0 62 21/54-88 00
E-Mail: fred.hamprecht@iwr.uni-heidelberg.de
http://hci.iwr.uni-heidelberg.de/Staff/fhamprec

Siehe auch: NDR-Interview mit Professor Hamprecht