Einsatz von Open Source Software für Forschungs­daten­repositorien

Foto: UHH/Schneider

Für den Aufbau der Forschungsdatenrepositorien im Projekt Hamburg Open Science standen auch mangels kommerzieller Alternativen ausschließlich Open-Source-Alternativen für die Auswahl zur Verfügung. Die TU Hamburg hat sich für die Software DSpace mit der Erweiterung DSpace-CRIS entschieden, die Universität Hamburg für die Software Invenio/Zenodo. Beide Repositorien sind standardkonform aufgebaut, so dass mittel- und langfristig bei Bedarf die Migration in ein anderes System erfolgen kann.

Invenio RDM

Invenio ist ein Open Source Repository-Framework für mittlere bis sehr große Repositorien unterschiedlichsten Typs. Die Entwicklung wird federführend am CERN betrieben. Knapp 100 Repositorien weltweit werden auf der Basis von Invenio betrieben. Das wahrscheinlich bekannteste davon ist Zenodo. Es wird von der Europäischen Kommission finanziert, vom CERN und dem EU-Projekt OpenAIRE betrieben und existiert seit 2013 als nichtkommerzielles Repositorium für Forschende aller Disziplinen und Nationen.

Der Erfolg von Zenodo basiert vor allem darauf, dass es eine der wenigen kostenfreien Möglichkeiten darstellt, Daten und Publikationen sichtbar (mit einer DOI) und sicher (für mindestens 20 Jahre) zu sichern und dabei gleichzeitig eine sehr niedrige Hürde aufstellt, da das Interface leicht zugänglich ist. Insbesondere letzteres hat dazu geführt, dass viele Institutionen den auf Invenio basierenden Zenodo-Quellcode für den Aufbau eigener Repositorien verwendet haben – wofür dieser ursprünglich gar nicht vorgesehen war.

Dieser Umstand und die generell starke Nachfrage nach leistungsfähiger Repositorien-Software für das Forschungsdatenmanagement führte dazu, dass im Projekt Invenio RDM die Entwicklung eines Invenio “flavors” begonnen wurde, der die (erweiterte) Funktionalität von Zenodo als einfach zu installierende und zu wartende, schlüsselfertige Software an-strebt und gleichzeitig eine Community aufbauen möchte, die die Weiterentwicklung und Pflege des Codes sicherstellen kann.

DSpace

DSpace ist ein Open-Source-Softwarepaket für den Betrieb von Repositorien. Ziel ist die Bereitstellung digitaler Inhalte für Endnutzer*innen und die Bereitstellung von Werkzeugen für die Verwaltung und Erhaltung von Inhalten innerhalb der Anwendung. DSpace wurde ursprünglich am MIT entwickelt und ist die am weitesten verbreitete Repository-Softwareplattform (Open Source oder proprietär), mit mehr als 2.500 Installationen weltweit. Die DSpace-Entwicklung wird über die gemeinnützige Organisation Lyrasis koordiniert. Zentrale Aufgaben wie die Softwarekoordination werden über Mitgliedschaften und Sponsoring finanziert.

Für DSpace steht die von 4Science entwickelte Open-Source-Erweiterung DSpace-CRIS zur Verfügung, die DSpace mit vielen Funktionen ergänzt, die der Darstellung des Forschungsoutputs einer Einrichtung dienen. Die TU Hamburg nutzt DSpace-CRIS 5.10 für ihr Forschungsdatenrepositorium in TUHH Open Research.

Unterstützung und Weiterentwicklung

Open Source Software (OSS) steht unter einer Lizenz, die die Weiterverbreitung, Weiterentwicklung und den freien Zugang zum Quellcode garantiert. Im Gegensatz zu proprietärer Software vermeidet der Einsatz von quelloffener Software den Vendor Lock-In, also die Abhängigkeit von einem einzelnen Hersteller. Einmal entwickelte Software im Quellcode weiterverbreiten zu können und Abhängigkeiten von einzelnen Herstellern zu vermeiden, sind wichtige Voraussetzungen, um Software gemeinsam mit anderen zu entwickeln. Eine aktive Open Source Community kann darauf aufsetzen und ist eine mögliche Antwort auf die Frage wie man Softwareentwicklung und -nutzung nachhaltig gestalten kann.
Während die Nutzung von Open-Source-Software kostenlos ist, ist es die Weiterentwicklung in der Regel nicht. Genau wie bei kommerzieller Software muss die Programmierung und Softwarekoordination sichergestellt werden. Im Sinne der Nachhaltigkeit haben sowohl die TU als auch die Universität Hamburg sich im Rahmen des Programms Hamburg Open Science intensiv an der Sicherung der Weiterentwicklung der ausgewählten Software und der dazugehörigen Open Source Community beteiligt.

In diesem Projektbericht wird beschrieben, welchen Beitrag beide Universitäten zu der jeweiligen Software beigesteuert haben:
Rajski, Beate, & Wörner, Kai. (2019). Einsatz von Open Source Software für Forschungsdatenrepositorien. Zenodo. https://doi.org/10.5281/zenodo.4326983