Machine Learning : Maschinelles Lernen mit sensiblen Daten

Daniel Bachlechner Leiter der Forschungsgruppe Advanced Data Analytics bei der Fraunhofer Austria Research
© Fraunhofer Austria

In den Daten, die von Unternehmen in immer größerer Menge erfasst und gespeichert werden, steckt enormes Potenzial, das sich mit Verfahren des maschinellen Lernens erschließen lässt. Da einerseits maschinelles Lernen mit großen Datenmengen besonders gut funktioniert und es sich andererseits nicht für jedes Unternehmen lohnt, Know-How und Infrastruktur für die Anwendung entsprechender Verfahren aufzubauen, würde sich für Unternehmen eine Zusammenarbeit anbieten.

Geht es um sensible Daten, ist das für viele Unternehmen aber nur dann eine Option, wenn geeignete Sicherheitsvorkehrungen getroffen werden.

Jahrelange Forschung

An Methoden, die eine sichere Verarbeitung von Daten erlauben, wird seit Jahren geforscht. Bisherige Ergebnisse zeigen, dass eine bestimmte Art der Verschlüsselung sich – zumindest in der Theorie – dafür eignet, sicheres maschinelles Lernen auf sensiblen Daten zu ermöglichen.

Ob und wie genau diese Methode auch in der Praxis sinnvoll eingesetzt werden kann, will nun ein Konsortium aus mehreren Unternehmen und Forschungseinrichtungen im FFG-Projekt SMiLe unter der Leitung von Fraunhofer Austria prüfen. Der Kick-Off für das Projekt erfolgte im April.

Homomorphe Verschlüsselung

Ein vielversprechender Ansatz, um dieses Ziel zu erreichen, ist nach Meinung der Forscherinnen und Forscher die sogenannte homomorphe Verschlüsselung. „Die Methode ist am ehesten mit einer undurchsichtigen Handschuhbox vergleichbar. Das bedeutet, jemand kann Gegenstände hineinlegen und die Box versperren und jemand anderer kann – indem er seine Hände in die Handschuhe steckt – mit den Gegenständen in der Box arbeiten, ohne sie dabei aber zu sehen“, erklärt Michael Rader, wissenschaftlicher Mitarbeiter bei Fraunhofer Austria.

Praxiswissen und geeignete Software

Es wurde bereits gezeigt, dass Berechnungen auf derart verschlüsselten Daten tatsächlich durchgeführt werden können, in der Praxis fehlen allerdings Know-how und geeignete Software. Das will das Forschungsteam nun ändern: SMiLe adressiert beide Aspekte und will damit eine wesentliche Voraussetzung für den praktischen Einsatz von maschinellem Lernen auf verschlüsselten Daten schaffen.

Fill will Predictive Maintenance …

Mit Fill ist ein Unternehmen an Bord, das auf Basis einer technischen Plattform, die von Tributech bereitgestellt wird, Maschinendaten für vorausschauende Instandhaltung – Predictive Maintenance – nutzbar machen möchte, ohne dass dabei sensible Daten, aus denen Prozess-Know-How der Maschinenbetreiber rekonstruiert werden könnte, offenbart werden

… Core will Teams zusammenstellen

Bei Core smartwork hingegen liegt der Fokus auf der Nutzung sensibler Mitarbeiterdaten. Mittels maschinellen Lernens möchte das Unternehmen seine Kunden bei der Zusammenstellung von Teams unterstützen, die nicht nur eine effiziente Aufgabenerfüllung sicherstellen, sondern auch eine arbeitsintegrierte Weiterbildung von Mitarbeitern erlauben.

„Die Technologie auch für Endanwender nutzbar machen“

Patrick Lamplmair, CTO bei Tributech, sieht die homomorphe Verschlüsselung als Enabler für Datendienste in vertrauenswürdigen Ökosystemen, mit denen auch hochsensible Daten entlang der Wertschöpfungskette genutzt werden können. „Ziel von Tributech ist es, die entwickelte Lösung in Zukunft als Erweiterung des DataSpace Kits anzubieten und damit die Technologie auch für Endanwender einfach nutzbar zu machen“, erklärt Patrick Lamplmair.

Über das Forschungsprojekt SMiLe:

Das Projekt „Secure Machine Learning Applications with Homomorphically Encrypted Data“ (SMiLe) wird unter der Projektnummer 886524 vom Bundesministerium für Klimaschutz, Umwelt, Energie, Mobilität, Innovation und Technologie (BMK) im Rahmen der 8. Ausschreibung des Programms „IKT der Zukunft“ gefördert. Fraunhofer Austria setzt das Projekt gemeinsam mit dem Management Center Innsbruck, dem Software Competence Center Hagenberg und dem VRVis Zentrum für Virtual Reality und Visualisierung sowie den Unternehmen Fill, Core smartwork und Tributech um. Das Projekt läuft seit April 2021 und endet im September 2023 nach einer Laufzeit vom 30 Monaten.