Hasso-Plattner-Institut
Hasso-Plattner-Institut
  
Login
  • de
 

Maxim Schnjakin

Cloud-RAID: Eine Methode zur Bereitstellung zuverlässiger Speicherressourcen in öffentlichen Clouds

Die Beliebtheit und Relevanz von Cloud-Speicherlösungen für Unternehmen hat in den letzten Jahren vermehrt zugenommen - die damit verbundenen Erwartungen sind vielfaltig: bessere Skalierbarkeit, Kosteneinsparungen, Auslagerung nicht-wertschöpfender Aktivitäten und sicheres Vorhalten der Daten. Trotz wirtschaftlicher Vorteile zögern jedoch viele Unternehmen, interne Daten an externe Anbieter zu übertragen, besonders wenn es sich dabei um vertrauliche Daten wie Kundeninformationen, Buchhaltung oder juristische Dokumente handelt.

Dabei werden Diskussionen um Chancen und Risiken des Speicherns in der „Wolke“ häufig zu pauschal geführt - denn Anbieter ist hier längst nicht gleich Anbieter. Im Rahmen der vorliegenden Arbeit sind Methoden entwickelt worden, mit denen sich bestimmte Cloud-typische Herausforderungen, wie beispielsweise Zuverlässigkeit bei externer Datenspeicherung, lösen lassen.

Der Beitrag der Forschungsarbeit besteht in der automatisierten Verteilung der Daten basierend auf den Anforderungen der Anwender. Ein zentrales Problem ist dabei die Identifikation eines oder mehrerer Dienste unter funktional äquivalenten Angeboten, deren Eigenschaften zu individuellen Anforderungen am besten passen. Zur Erreichung des Vorhabens muss ein Weg gefunden werden, die Dienste und Anforderungen eindeutig zu spezifizieren. Zu diesem Zweck wird ein Modell aufgestellt, mit dem sich Eigenschaften der Cloud-Speicheranbieter und Anwenderanforderungen beschreiben und vergleichen lassen.

Im ersten Schritt werden Merkmale der Cloud-Speicherdienste untersucht, um diese als wesentliche Entitäten eines Modells abzubilden. Basierend darauf lassen sich Eigenschaften als Leistungsmerkmale und Anforderungen formal spezifizieren. Zur Bestätigung des Forschungsansatzes werden die Speicherdienste in dieser Arbeit anhand von drei Leistungsmerkmalen beschrieben: Performance, Kosten und Verfügbarkeit. Die Umsetzung anwenderspezifischer Anforderungen an die Verfügbarkeit bedarf einer zusätzlichen Verarbeitung der Ausgangsdaten. Dies lässt sich darauf zurückführen, dass Anbieter von Cloud-Speicherdiensten nur eingeschränkte Verfügbarkeit für ihrer Dienste garantieren. Die Lösung der Fragestellung erfordert die Verteilung der Daten auf unterschiedliche Quellen unter Verwendung fehlerkorrigierender Algorithmen.

Bemerkenswert ist die Tatsache, dass durch parallele Zugriffe auf codierte Datenpakete sich sowohl eine Erhöhung der Übertragungsleistung als auch der Verfügbarkeit erreichen lässt. Damit steigt jedoch auch die Komplexität der Entscheidungsfindung bezüglich der eigentlichen Datenverteilung. Im Verlauf der Arbeit ist gezeigt worden, dass die Auswahl und die Konfiguration eines fehlerkorrigierenden Verfahrens vielseitig und schwierig ist, und daher durch einen menschlichen Experten vorzunehmen ist.

Das Ziel der Arbeit ist jedoch, die Daten der Anwender mit möglichst wenigen menschlichen Interaktionen auf die Cloud-Speicherressourcen zu verteilen und dabei den zeit- und kostenintensiven Einsatz von menschlichen Experten auf ein Minimum zu reduzieren. Zur Umsetzung des Vorhabens wurde zusätzlich ein mathematisches Optimierungsmodell aufgestellt, das basierend auf den formalen Beschreibungen der Dienste und definierten Anforderungen der Anwender eine automatisierte Konfiguration des Systems zur Verteilung der Daten vornimmt. Nach der Vorstellung der prototypischen Implementierung des Cloud-RAID Systems erfolgt anschließend die theoretische und praktische Untersuchung der Leistungsfähigkeit des Forschungsansatzes.