FAUDataCloud – IT-Services für Forschungsdaten

Überblick

Die Competence Unit Research Data and Information (CDI) und das Regionale Rechenzentrum Erlangen (RRZE) unterstützen das Forschungsdatenmanagement (FDM) an der FAU im Rahmen der FAUDataCloud-Initiative. Das Klinikum Erlangen soll mittelfristig über das Medizinische Zentrum für Informations- und Kommunikationstechnik (MIK) einbezogen werden.

Das FDM wird im Rahmen der FAUDataCloud zunächst in der passiven Phase des Forschungsdatenzyklus unterstützt (Publikation, Archivierung, Nachnutzung). Die aktive Phase (Planung, Datenerhebung und -analyse) geschieht weiterhin durch die Forschungsprojekte selbst. Lediglich die Datenerhebung wird durch zentrale Bereitstellung von Systemen erleichtert, in welchen die für die passive Phase notwendigen Metadaten bereits initial hinterlegt werden.

Konzeption

  1. Systeme für Storage und Standardanwendungen (z.B. Standard-Datenbanken) werden beschafft und betrieben vom RRZE bzw. MIK.
  2. Höhere Dienste der FAUDataCloud setzen darauf auf und werden in Abstimmung betrieben von CDI, RRZE bzw. MIK.
  3. Eine FDM-Grundversorgung (siehe unten) ist für Organisationseinheiten der FAU kostenfrei.
  4. Darüber hinausgehende Ressourcenbedarfe für die Grundversorgung von der CDI geprüft und genehmigt – die Regelungen dafür entwickeln die Mitglieder der CDI zusammen mit RRZE / MIK,
  5. Forschungsprojekte müssen spezielle FDM-Mehrbedarfe innerhalb der Antragsphase berücksichtigen, die CDI kann beraten und oft kompetentes Personal vermitteln.
  6. Die organisationsinterne (Lehrstuhl, Professur, Projekt) Verteilung der Ressourcen erfolgt dezentral.

Zeitplan

  • 03/2022 – Grundversorgung Speicherplatz – Testbetrieb
  • 05/2022 – Grundversorgung Speicherplatz – Pilotbetrieb
  • Q3/2022 – Höhere Dienste – Testbetrieb
  • 07/2022Grundversorgung Speicherplatz
  • 08/2022Erweiterte Grundversorgung und Projektversorgung Speicherplatz
  • Q4/2022 – Höhere Dienste – Pilotbetrieb
  • 01/2023 – FDM-Grundversorgung Testbetrieb Datenbanken

FDM-Grundversorgung

Self-Service-Dienste

Im Rahmen der Grundversorgung steht jeder Forschungsgruppe der FAU (Lehrstuhl, unabhängige Professur; alles mit einer Kostenstelle) die folgenden IT-Ressourcen unentgeltlich zu:

  • 2 TB Archivplatz (kumulativ): Pro Datensatz müssen in CRIS die Metadaten (nach FAIR-Prinzipien; analog DataCite Schema) und ein FAU-Datentestament ausgefüllt werden. Anschließend erfolgt die Zuteilung automatisch.
    • Dieser Bereich enthält nur abgeschlossene Datensätze (read-only), welche damit eindeutig referenziert werden können.
    • Persistente Identifikatoren (PID) zur Referenzierung
      • FAU-PID: immer
      • DOI: bei Veröffentlichung der Metadaten
  • 100 GB Projektspeicher (Netzlaufwerk; akademische Nutzung beliebig): Antrag und Rechte-/Rollen-Verwaltung bevorzugt über IDM-Portal.
  • (ab Ende 2022) 50 GB Datenbankplatz (PostgreSQL/MySQL/?/…/NoSQL), Antrag und Rechteverwaltung erfolgen über das IDM-Portal.
  • Allgemeine Dienste (GitLab, Chat-Service, …) in RRZE-Regelbetrieb überführen.
  • Höhere/Spezifische Dienste (ELN, WissKI, JupyterLab, etc) werden unkonfiguriert bereitgestellt (Beratung über Kurse); Speicherplatz wird aus dem Projektspeicher/DB-Speicherplatz genommen; die Rechenzeit ist begrenzt. Antrag und Rechte-/Rollenverwaltung erfolgen über das IDM-Portal.

Erweiterte Grundversorgung (ab Verfügbarkeit der Self-Service-Dienste)

Bedarfe, die über die Grundversorgung hinausgehen, können bei der CDI beantragt werden. Dies gilt auch für Projekte/Forschungsdaten, die keiner Kostenstelle zugeordnet werden können (z.B. Projekte von Studierenden). Die Bedarfe werden dann von der CDI geprüft und nach Priorität eingeordnet; die Kriterien sind:

  1. akademische Begründung & Strategie zur Datenkuration;
  2. Gesamt-Ressourcenbedarf; warum konnte das nicht im Projekt beantragt werden.
  3. Gibt es ein Endorsement des Departments, …
  4. Intendierte Lizensierung des Datensatzes (freier/offener ist besser)
  5. Datentestament (was passiert, wenn Daten verwaisen, z.B. weil der „Eigentümer“ die FAU verlässt)
  6. Adäquatheit/Qualität der Metadaten.

Der Antrag auf erweiterte Grundversorgung sollte so ausführlich sein, dass diese Kriterien beurteilt werden können. Außerdem muss dieser alle administrativen Metadaten (zur automatischen Einrichtung; Impressum, etc; FAU-Datentestament) enthalten. Die erweiterte kostenlose Grundversorgung ist außerdem abhängig von den zur Verfügung stehenden zentralen Ressourcen.

Die CDI richtet zur Begutachtung der erweiterten Grundversorgung eine Kommission aus CDI-Mitgliedern (fachliche Abdeckung wird sichergestellt) ein, die die Anträge einmal im Monat bearbeitet.

FDM-Projektversorgung

Großprojekte wie GRK/SFB müssen gesondert zwischen Antragsteller, Kanzler, CIO und KL@CDI (vertreten durch Geschäftsführer) geplant/verhandelt/finanziert werden. Kriterien wie bei der erweiterten Projektversorgung (oben), wobei ein bewilligter SFB/GRK einen Teil der o.g. Kriterien automatisch erfüllt.