FAUDataCloud – IT-Services für Forschungsdaten
Überblick
Die Competence Unit Research Data and Information (CDI) und das Regionale Rechenzentrum Erlangen (RRZE) unterstützen das Forschungsdatenmanagement (FDM) an der FAU im Rahmen der FAUDataCloud-Initiative. Das Klinikum Erlangen soll mittelfristig über das Medizinische Zentrum für Informations- und Kommunikationstechnik (MIK) einbezogen werden.
Das FDM wird im Rahmen der FAUDataCloud zunächst in der passiven Phase des Forschungsdatenzyklus unterstützt (Publikation, Archivierung, Nachnutzung). Die aktive Phase (Planung, Datenerhebung und -analyse) geschieht weiterhin durch die Forschungsprojekte selbst. Lediglich die Datenerhebung wird durch zentrale Bereitstellung von Systemen erleichtert, in welchen die für die passive Phase notwendigen Metadaten bereits initial hinterlegt werden.
Konzeption
- Systeme für Storage und Standardanwendungen (z.B. Standard-Datenbanken) werden beschafft und betrieben vom RRZE bzw. MIK.
- Höhere Dienste der FAUDataCloud setzen darauf auf und werden in Abstimmung betrieben von CDI, RRZE bzw. MIK.
- Eine FDM-Grundversorgung (siehe unten) ist für Organisationseinheiten der FAU kostenfrei.
- Darüber hinausgehende Ressourcenbedarfe für die Grundversorgung von der CDI geprüft und genehmigt – die Regelungen dafür entwickeln die Mitglieder der CDI zusammen mit RRZE / MIK,
- Forschungsprojekte müssen spezielle FDM-Mehrbedarfe innerhalb der Antragsphase berücksichtigen, die CDI kann beraten und oft kompetentes Personal vermitteln.
- Die organisationsinterne (Lehrstuhl, Professur, Projekt) Verteilung der Ressourcen erfolgt dezentral.
Zeitplan
- 05/2022 – Grundversorgung Speicherplatz – Testbetrieb
- 07/2022 – Grundversorgung Speicherplatz – Pilotbetrieb
- Q3/2022 – Höhere Dienste – Testbetrieb
- 10/2022 – Grundversorgung Speicherplatz
- 11/2022 – Erweiterte Grundversorgung und Projektversorgung Speicherplatz
- Q4/2022 – Höhere Dienste – Pilotbetrieb
- 01/2023 – FDM-Grundversorgung Testbetrieb Datenbanken
FDM-Grundversorgung
Self-Service-Dienste
Im Rahmen der Grundversorgung steht jeder Forschungsgruppe der FAU (Lehrstuhl, unabhängige Professur; alles mit einer Kostenstelle) die folgenden IT-Ressourcen unentgeltlich zu:
- 2 TB Archivplatz (kumulativ): Pro Datensatz müssen in CRIS die Metadaten (nach FAIR-Prinzipien; analog DataCite Schema) und ein FAU-Datentestament ausgefüllt werden. Anschließend erfolgt die Zuteilung automatisch.
- Dieser Bereich enthält nur abgeschlossene Datensätze (read-only), welche damit eindeutig referenziert werden können.
- Persistente Identifikatoren (PID) zur Referenzierung
- FAU-PID: immer
- DOI: bei Veröffentlichung der Metadaten
- 50 GB Projektspeicher (Netzlaufwerk; akademische Nutzung beliebig): Antrag und Rechte-/Rollen-Verwaltung bevorzugt über IDM-Portal.
- (ab Ende 2022) 50 GB Datenbankplatz (PostgreSQL/MySQL/?/…/NoSQL), Antrag und Rechteverwaltung erfolgen über das IDM-Portal.
- Allgemeine Dienste (GitLab, Chat-Service, …) in RRZE-Regelbetrieb überführen.
- Höhere/Spezifische Dienste (ELN, WissKI, JupyterLab, etc) werden unkonfiguriert bereitgestellt (Beratung über Kurse); Speicherplatz wird aus dem Projektspeicher/DB-Speicherplatz genommen; die Rechenzeit ist begrenzt. Antrag und Rechte-/Rollenverwaltung erfolgen über das IDM-Portal.
Erweiterte Grundversorgung (ab Verfügbarkeit der Self-Service-Dienste)
Bedarfe, die über die Grundversorgung hinausgehen, können bei der CDI beantragt werden. Dies gilt auch für Projekte/Forschungsdaten, die keiner Kostenstelle zugeordnet werden können (z.B. Projekte von Studierenden). Die Bedarfe werden dann von der CDI geprüft und nach Priorität eingeordnet; die Kriterien sind:
- akademische Begründung & Strategie zur Datenkuration;
- Gesamt-Ressourcenbedarf; warum konnte das nicht im Projekt beantragt werden.
- Gibt es ein Endorsement des Departments, …
- Intendierte Lizensierung des Datensatzes (freier/offener ist besser)
- Datentestament (was passiert, wenn Daten verwaisen, z.B. weil der „Eigentümer“ die FAU verlässt)
- Adäquatheit/Qualität der Metadaten.
Der Antrag auf erweiterte Grundversorgung sollte so ausführlich sein, dass diese Kriterien beurteilt werden können. Außerdem muss dieser alle administrativen Metadaten (zur automatischen Einrichtung; Impressum, etc; FAU-Datentestament) enthalten. Die erweiterte kostenlose Grundversorgung ist außerdem abhängig von den zur Verfügung stehenden zentralen Ressourcen.
Die CDI richtet zur Begutachtung der erweiterten Grundversorgung eine Kommission aus CDI-Mitgliedern (fachliche Abdeckung wird sichergestellt) ein, die die Anträge einmal im Monat bearbeitet.
FDM-Projektversorgung
Großprojekte wie GRK/SFB müssen gesondert zwischen Antragsteller, Kanzler, CIO und KL@CDI (vertreten durch Geschäftsführer) geplant/verhandelt/finanziert werden. Kriterien wie bei der erweiterten Projektversorgung (oben), wobei ein bewilligter SFB/GRK einen Teil der o.g. Kriterien automatisch erfüllt.