Academic Cloud: Wie File­sharing für For­schungs­daten funktioniert

Die Academic Cloud ist für über 200.000 User kon­zi­piert und stellt mit einer Speicher­kapazität von rund 1 Peta­byte be­son­dere An­for­de­run­gen an die Ser­ver­architek­tur. Doch der Auf­wand lohnt sich: Die Open-Source-basierte Lösung ist ein wei­te­res Bei­spiel für er­folg­reiche Ver­netzung in For­schung und Bildung.

Filesharing für die Forschung

Von Tobias Gerlinger, ownCloud

Im Zeitalter weltweiten Datenaustauschs stehen auch Universitäten immer stärker im internationalen Wettbewerb. Der Hauptgrund dafür: Daten werden – gerade wegen des hohen Vernetzungsgrades – zum Wettbewerbsfaktor. Empirische Erhebungen, Studiendaten, experimentelle Ergebnisse, Protokolle, Tabellen, Dokumente, Zahlen und vieles mehr: Universitäten produzieren fortlaufend gewaltige Datenschätze, deren Wert erst dann vollständig gehoben werden kann, wenn diese Daten sinnvoll miteinander verknüpft und durch intelligente Auswertungsverfahren für Forschende und Lehrende nutzbar gemacht werden.

Bedarfslage und Notbehelfe

Eine zentrale Rolle spielt dabei selbstverständlich die Cloud. Während private Nutzer auf proprietäre Lösungen wie Dropbox setzen können, bestehen im akademischen Kontext deutlich höhere Anforderungen, sowohl in Bezug auf die Datenmenge (zum Beispiel bei Rohdaten aus experimentellen Messungen) als auch in Bezug auf die Datensicherheit, da viele Informationen auch für potenzielle Angreifer interessant sind.

Wenn Universitäten keine zentralen Lösungen zur Verfügung stellen, droht außerdem die Entstehung von „Informationssilos“, etwa wenn Forschende und Lehrende unterschiedliche Systeme parallel einsetzen, die nicht miteinander kompatibel sind. Es kommt nicht selten vor, dass ein Student im Laufe seiner akademischen Karriere einen Dropbox- einen Google-, einen OneDrive– und zahlreiche weitere Accounts anlegen muss, weil ein Dozent in einem Kurs ein anderes System bevorzugt als sein Kollege nebenan. Datensilos aber hemmen die Kollaboration und vermindern die Effizienz.

Rechenzentren 2018-03.jpg

Schwarz auf Weiß
Dieser Beitrag erschien zuerst in unserer Magazin­reihe „Rechen­zentren und Infra­struktur“. Einen Über­blick mit freien Down­load-Links zu sämt­lichen Einzel­heften bekommen Sie online im Presse­zentrum des MittelstandsWiki.

Cloud-basierte, standardisierte Lösungen mit hoher Nutzerfreundlichkeit haben im universitären Kontext das Potenzial, die Datennutzung nachhaltig zu verändern und die Produktivität der Forschung zu steigern. Dieses Bewusstsein ist auch bei den Universitäten angekommen, und immer mehr Bundesländer investieren darum in landesweite Lösungen, um Forschung und Lehre universitätsübergreifende Plattformen zur Verfügung zu stellen. Das jüngste Beispiel ist Niedersachsen.

Academic Cloud Niedersachsen

Anfang Juli 2018 kündigten der Enterprise-Filesharing-Softwarehersteller ownCloud und der Landesarbeitskreis Niedersachsen für Informationstechnik (LANIT) den offiziellen Start ihrer gemeinsamen Kollaborationsplattform Academic Cloud an. Der Service bietet allen Studierenden, Lehrenden und Mitarbeitern der niedersächsischen Hochschulen die Möglichkeit, unentgeltlich Daten im Umfang von bis zu 50 GByte abzulegen und mit anderen Nutzern zu teilen und gemeinsam zu bearbeiten. Gefördert wird das Projekt vom Niedersächsischen Ministerium für Wissenschaft und Kultur, während die technische Umsetzung die Gesellschaft für wissenschaftliche Datenverarbeitung in Göttingen (GWDG) übernimmt.

Die Idee hinter der Academic Cloud ist, Studenten und Mitarbeitern einen einheitlichen Filesharing-Dienst zur Verfügung zu stellen. Die Plattform wird in akademischen Rechenzentren nach deutschen Datenschutz- und Datensicherheitsrichtlinien gehostet und wurde speziell für den Einsatz im Forschungs- und Bildungsbereich entwickelt. Im Gegensatz zu den meisten konsumentenorientierten File-Sync-and-Share-Diensten ermöglicht ownCloud den Betrieb auf eigenen Servern, ohne dass man deswegen auf Kollaborationsfunktionen verzichten müsste. Die Academic Cloud stieß nach ihrer Einführung auf breite Resonanz und ist bereits an neun Hochschulen des Bundeslandes verfügbar. Pilotteilnehmer sind zum Beispiel die Universität Hildesheim, die Medizinische Hochschule Hannover, die Hochschule Hannover, die Technische Universität Clausthal, die Hochschule Emden/Leer und die Universität Vechta.

Die Academic Cloud basiert auf der Technologie von ownCloud, die Funktionalität lässt sich durch das einheitliche Authentifizierungssystem aber um zusätzliche Dienste erweitern. „Der einfache und sichere Datenaustausch bildet die Basis für weitergehende Kollaborationsfunktionen, die im Laufe dieses und nächsten Jahres hinzukommen – wie zum Beispiel Office-Funktionalitäten oder andere Software-Anwendungen“, betont Projektleiter Ralph Krimmel, der seitens der GWDG verantwortlich für die Umsetzung ist.

MW-KommRZ3.2018.ID05-ACCLOUD.jpg
Academic-Cloud-Architektur (Bild: ownCloud)

Fokus auf Skalierbarkeit

Das Hosting der Academic Cloud erfolgt dezentral an drei unabhängigen Serverstandorten. Sie ist im Kern eine ownCloud-Plattform für bis zu 210.000 User, denen jeweils 50 GByte zur Verfügung stehen. Die Gesamtspeicherkapazität beträgt damit insgesamt rund 1 Petabyte. Die Infrastruktur dahinter bilden vier Apache-Webserver mit ownCloud 10 Enterprise. Als verteilte Storage-Lösung fungiert ein S3 Object Storage über Ceph. Object Storages bringen den Vorteil einer besonders leichten Skalierbarkeit), und ownCloud bietet seit Version 8 ein Object-Storage-Plugin. Das Load Balancing der Webserver erfolgt durch ein HA-Pärchen Kemp-LoadMaster. Benutzersessions, File Locking und Caching in ownCloud werden mit Redis umgesetzt.

Die Datenbankserver sind in einem Galera Cluster angeordnet. Dieser Aufbau bietet den Vorteil, dass sich Datenbanken (in diesem Fall Percona XtraDB) synchron in Multi-Master-Umgebungen replizieren lassen. Der Cluster entfernt auch automatisch ausgefallene Lese- und Schreibknoten. Neue Knoten können automatisch in das Cluster aufgenommen werden. Die Replikation erfolgt parallel auf SQL-Zeilenebene. Gegenüber der eingebauten Master-Slave-Replikation bringt Galera vor allem den Vorteil einer besseren Skalierbarkeit beim Lesen und Schreiben – und mehr Sicherheit beim Dateiaustausch.

In puncto Skalierbarkeit gelangen aber auch Galera-Architekturen an ihre natürlichen Grenzen. Um diese zu erweitern, nutzen die Administratoren der Academic Cloud den Datenbank-Proxy MaxScale. Er sorgt für eine nahtlose Kommunikation zwischen dem Datenbank-Cluster und den Webservern. Durch Read-Write-Splitting wird zusätzlich die Last auf das Datenbank-Cluster verteilt. MaxScale überwacht jeden Knoten im Cluster und leitet die Anfragen nur an vollständig synchronisierte Nodes weiter. Das Ergebnis ist eine hohe Verfügbarkeit des Clusters, selbst wenn einige Knoten entfernt wurden. Dadurch ist selbst im Falle von Updates oder Wartungsarbeiten die Funktionalität des Clusters gewährleistet. Die hohe Skalier- und Verfügbarkeit bietet nicht zuletzt auch den Admins zusätzliche Flexibilität, die damit jederzeit volle Kontrolle über sämtliche Dateien haben.

Kontrolle ist auch ein wichtiges Thema beim Einsatz der Software. Die Filesharing-Lösung von ownCloud gewährleistet jederzeit die volle Souveränität der Nutzer über ihre eigenen Dateien. Dateifreigaben lassen sich einfach und flexibel erteilen, die Freigabe zeitlich limitieren und wieder rückgängig machen. Das Sharing in einzelnen Gruppen mit speziellen Rechten ist ebenfalls möglich. Über ein zentrales Interface kann jeder Berechtigte auf die Dateien zugreifen – unabhängig von Gerät, Betriebssystem oder sonstigen Faktoren. Daten können so ohne Einschränkungen geteilt oder gemeinsam bearbeitet werden.

Tobias-Gerlinger.jpg

Tobias Gerlinger ist seit 2016 Geschäftsführer und CEO der 2011 gegründeten ownCloud GmbH. Das Unternehmen arbeitet mit der gleichnamigen Open-Source-Software und stellt damit z.B. Private-Cloud-Strukturen auf oder organisiert Datenaustauschlösungen für Firmen und Organisationen.


ownCloud GmbH, Rathsbergstr. 17, 90411 Nürnberg, Tel.: 0911-14888690, info@owncloud.com, https://owncloud.com/de/

Bildung bedingt Austausch

Niedersachsen mit seiner Academic Cloud ist allerdings nicht das erste Bundesland, das ownCloud als zentrale, Open-Source-basierte Filesharing-Lösung für Universitäten einsetzt. Bereits 2015 ging mit Sciebo in Nordrhein-Westfalen die erste Forschungs- und Bildungscloud an den Start, die mittlerweile über 100.000 aktive Nutzer zählt und sich damit zu einem echten Erfolgsprojekt entwickelt hat: „Wir freuen uns, dass immer mehr Universitäten auf offene Cloud-Lösungen setzen. Forschung und Bildung leben vom gegenseitigen Austausch und mit unserer Open-Source-Software setzen wir dieses wissenschaftliche Grundprinzip auf Technologieebene um“, sagt Holger Dyroff, Geschäftsführer und COO von ownCloud.

Insbesondere in Forschung und Bildung bietet die Cloud eine Riesenchance, die moderne Informationsgesellschaft mitzugestalten und die Wettbewerbsfähigkeit des Standorts zu erhöhen. Investitionen in den Ausbau der IT-Infrastrukturen von Hochschulen haben das Potenzial, völlig neue Möglichkeiten in der Zusammenarbeit von Wissenschafts- und Lehrinstitutionen, auch über Campusgrenzen hinweg, zu erschließen. Schließlich wird der wissens- und innovationsbasierte Wettlauf um Exzellenz, Fachkräfte und (publizistische) Vorreiterrollen zunehmend vom Treibstoff der digitalen Transformation bestimmt: von Daten.

Nützliche Links