Empfehlungssysteme brauchen weit weniger Daten als angenommen

Veröffentlicht am:

Ein kürzlich veröffentlichtes wissenschaftliches Paper eines internationalen Forscherteams zum Thema „Verteile Empfehlungssysteme“ kommt zum Schluss, dass viele persönliche Daten nötig sind, um bessere Empfehlungen abzugeben. Unser Social-Computing Team reproduzierte die Studie und widerlegte das Ergebnis.

Empfehlungssysteme begegnen uns überall. Täglich werden uns Produkte, Dienstleistungen oder Musik empfohlen. Traditionell werden die Systeme zentralisiert organisiert. Das bedeutet, dass sensible Daten und Modelle von Dienstleistern in einem externen Rechenzentrum verwaltet werden. Daten, die z.B. auf unserem Smartphone gespeichert sind, landen oftmals über Drittanbieter im Rechenzentrum. Das birgt die Gefahr, dass die Privatsphäre der User verletzt wird.

Verteilte Empfehlungssysteme: Private Daten verlassen Smartphone & Co. nicht

Bei „Verteilten Empfehlungssystemen“ bleiben die Daten direkt am Endgerät (z.B. Smartphone, Laptop, Smartwatch) gespeichert und verlassen das Gerät nicht. Auch Interaktionsdaten der Nutzer bleiben an Ort und Stelle. Damit ist die Privatsphäre von Nutzerinnen und Nutzern weitaus besser geschützt.

Kein Qualitätsverlust bei Empfehlungen von wenig-interaktiven Nutzern

Social Computing Research Area Manager Dominik Kowald über das interessante Ergebnis: „Wir reproduzierten das Paper und stellten mithilfe von KI-gestützten Methoden wie Federated-Learning & Meta-Learning fest, dass wir bei Nutzern mit wenig Interaktionsdaten so gut wie keinen Qualitätsverlust hatten. Ob sie nun 100% ihrer Daten teilten oder nur 30%. Nur bei Benutzern mit sehr vielen Interaktionsdaten war das anders.“

Als Beispiel:

 

Die Forschungsarbeit entstand im Rahmen des COMET-Moduls DDAI und dem EU-H2020 Projekt TRUSTS. Beide befassen sich thematisch mit der sicheren und erklärbaren Nutzung von sensiblen Daten. Das entstandene Reproducibility Paper „Robustness of Meta Matrix Factorization Against Strict Privacy Constraints“ wurde in der Session „Federated Learning” auf der ECIR 2021 präsentiert und ist frei verfügbar.

Zum Paper

Mehr zum Thema

No items found

Angebote Know-Center

Stellenangebote

Mehr zum Thema