Services des CDI

Das CDI entwickelt und betreibt verschiedenartige Services in Zusammenarbeit mit der Universitätsbibliothek, dem Regionalen Rechenzentrum (RRZE), dem Medizinischen Zentrum für Informations- und Kommunikationstechnik (MIK) und den Forschenden der FAU.

Hierbei decken die Services das gesamte Spektrum des Forschungsdatenmanagement ab, von der Beratung bei Anträgen über den Umgang mit Forschungsdaten während der Projektphase bis hin zur Archivierung und Publikation von Forschungsdatensätzen.

Eine wichtige Rollen spielt auch die Vernetzung von Forschungsdaten mit weiteren Forschungsinformationen, wie z.B. Publikationen, Forschungsprojekten, Auszeichnungen, usw. Dies betont die Leistungsfähigkeit der Forschenden und erhöht die Sichtbarkeit der Forschungsdaten.

FAUDataCloud - IT-Services für Forschungsdaten

Überblick

Das FAU Competence Center for Research Data and Information (CDI) und das Regionale Rechenzentrum Erlangen (RRZE) unterstützen das Forschungsdatenmanagement (FDM) an der FAU im Rahmen der FAUDataCloud-Initiative. Das Klinikum Erlangen soll mittelfristig über das Medizinische Zentrum für Informations- und Kommunikationstechnik (MIK) einbezogen werden.

Das FDM wird im Rahmen der FAUDataCloud zunächst in der passiven Phase des Forschungsdatenzyklus unterstützt (Publikation, Archivierung, Nachnutzung). Die aktive Phase (Planung, Datenerhebung und -analyse) geschieht weiterhin durch die Forschungsprojekte selbst. Lediglich die Datenerhebung wird durch zentrale Bereitstellung von Systemen erleichtert, in welchen die für die passive Phase notwendigen Metadaten bereits initial hinterlegt werden.

Konzeption

  1. Systeme für Storage und Standardanwendungen (z.B. Standard-Datenbanken) werden beschafft und betrieben vom RRZE bzw. MIK.
  2. Höhere Dienste der FAUDataCloud setzen darauf auf und werden in Abstimmung betrieben von CDI, RRZE bzw. MIK.
  3. Eine FDM-Grundversorgung (siehe unten) ist für Organisationseinheiten der FAU kostenfrei.
  4. Darüber hinausgehende Ressourcenbedarfe für die Grundversorgung von der CDI geprüft und genehmigt - die Regelungen dafür entwickeln die Mitglieder der CDI zusammen mit RRZE / MIK,
  5. Forschungsprojekte müssen spezielle FDM-Mehrbedarfe innerhalb der Antragsphase berücksichtigen, das CDI kann beraten und oft kompetentes Personal vermitteln.
  6. Die organisationsinterne (Lehrstuhl, Professur, Projekt) Verteilung der Ressourcen erfolgt dezentral.

Zeitplan

  • 05/2022 - Grundversorgung Speicherplatz - Testbetrieb
  • 07/2022 - Grundversorgung Speicherplatz - Pilotbetrieb
  • Q3/2022 - Höhere Dienste - Testbetrieb
  • 10/2022 - Grundversorgung Speicherplatz
  • 11/2022 - Erweiterte Grundversorgung und Projektversorgung Speicherplatz
  • Q4/2022 - Höhere Dienste - Pilotbetrieb
  • 01/2023 - FDM-Grundversorgung Testbetrieb Datenbanken

FDM-Grundversorgung

Self-Service-Dienste

Im Rahmen der Grundversorgung steht jeder Forschungsgruppe der FAU (Lehrstuhl, unabhängige Professur; alles mit einer Kostenstelle) die folgenden IT-Ressourcen unentgeltlich zu:

  • 2 TB Archivplatz (kumulativ): Pro Datensatz müssen in CRIS die Metadaten (nach FAIR-Prinzipien; analog DataCite Schema) und ein FAU-Datentestament ausgefüllt werden. Anschließend erfolgt die Zuteilung automatisch.
    • Dieser Bereich enthält nur abgeschlossene Datensätze (read-only), welche damit eindeutig referenziert werden können.
    • Persistente Identifikatoren (PID) zur Referenzierung
      • FAU-PID: immer
      • DOI: bei Veröffentlichung der Metadaten
  • 50 GB Projektspeicher (Netzlaufwerk; akademische Nutzung beliebig): Antrag und Rechte-/Rollen-Verwaltung bevorzugt über IDM-Portal.
  • (ab Ende 2022) 50 GB Datenbankplatz (PostgreSQL/MySQL/?/.../NoSQL), Antrag und Rechteverwaltung erfolgen über das IDM-Portal.
  • Allgemeine Dienste (GitLab, Chat-Service, ...) in RRZE-Regelbetrieb überführen.
  • Höhere/Spezifische Dienste (ELN, WissKI, JupyterLab, etc) werden unkonfiguriert bereitgestellt (Beratung über Kurse); Speicherplatz wird aus dem Projektspeicher/DB-Speicherplatz genommen; die Rechenzeit ist begrenzt. Antrag und Rechte-/Rollenverwaltung erfolgen über das IDM-Portal.

Erweiterte Grundversorgung (ab Verfügbarkeit der Self-Service-Dienste)

Bedarfe, die über die Grundversorgung hinausgehen, können bei der CDI beantragt werden. Dies gilt auch für Projekte/Forschungsdaten, die keiner Kostenstelle zugeordnet werden können (z.B. Projekte von Studierenden). Die Bedarfe werden dann von der CDI geprüft und nach Priorität eingeordnet; die Kriterien sind:

  1. akademische Begründung & Strategie zur Datenkuration;
  2. Gesamt-Ressourcenbedarf; warum konnte das nicht im Projekt beantragt werden.
  3. Gibt es ein Endorsement des Departments, ...
  4. Intendierte Lizensierung des Datensatzes (freier/offener ist besser)
  5. Datentestament (was passiert, wenn Daten verwaisen, z.B. weil der "Eigentümer" die FAU verlässt)
  6. Adäquatheit/Qualität der Metadaten.

Der Antrag auf erweiterte Grundversorgung sollte so ausführlich sein, dass diese Kriterien beurteilt werden können. Außerdem muss dieser alle administrativen Metadaten (zur automatischen Einrichtung; Impressum, etc; FAU-Datentestament) enthalten. Die erweiterte kostenlose Grundversorgung ist außerdem abhängig von den zur Verfügung stehenden zentralen Ressourcen.

Das CDI richtet zur Begutachtung der erweiterten Grundversorgung eine Kommission aus CDI-Mitgliedern (fachliche Abdeckung wird sichergestellt) ein, die die Anträge einmal im Monat bearbeitet.

FDM-Projektversorgung

Großprojekte wie GRK/SFB müssen gesondert zwischen Antragsteller, Kanzler, CIO und KL@CDI (vertreten durch Geschäftsführer) geplant/verhandelt/finanziert werden. Kriterien wie bei der erweiterten Projektversorgung (oben), wobei ein bewilligter SFB/GRK einen Teil der o.g. Kriterien automatisch erfüllt.

Forschungsinformationssystem FAU CRIS

Forschungsdaten sind eng mit Metadaten verbunden. Neben den FD-spezifischen Informationen ist die Verknüpfung mit weiteren Daten zu Forschung sinnvoll, wie Publikationen, Forschungsprojekten, Auszeichnungen, usw. Diese Daten werden an der FAU im Forschungsinformationssystem CRIS gesammelt.

FAU-spezifische Metadaten, z.B. wie mit Forschungsdaten verfahren wird, wenn sämtliche Beteiligte die FAU verlassen haben, werden daher in CRIS hinterlegt ("Datentestamente") und sichern so die langfristige Verfügbarkeit der Forschungsdaten.

Durch die Unterstützung deS CDI erhält CRIS eine bessere Anbindung an die Bedarfe der Forschenden. Weiterhin wird vermieden, für Informationen zu Forschungsdaten eine weitere Plattform aufzubauen.

Informationen zu CRIS finden Sie im Forschungsportal bzw. im CRIS-Handbuch.

Für CRIS werden regelmäßig Schulungen angeboten. Einen Überblick finden Sie im Schulungskalender, für eine Anmeldung schreiben Sie bitte an cris-support@fau.de.

Elektronische Laborbücher (ELN)

Einführung

Laborbücher sind das Logbuch der Forschenden, da dort die Planung, Durchführung und Auswertung von wissenschaftlichen Experimenten und der dabei generierten Forschungsdaten dokumentiert wird.

Zunehmend wird das Laborbuch als Electronic Lab Notebook (ELN) in digitaler Form geführt und ist dabei idealerweise in den Prozess des Forschungsdatenmanagements eingebunden: es kommuniziert mit anderen Tools im Lebenszyklus von Forschungsdaten (z. B. Analysesoftware) und ist unter anderem an ein System zur Speicherung von Daten angebunden.

Vorteile der Nutzung eines ELN

  • Effizientes Arbeiten durch Standardisierung, Suchfunktionen und Filtermöglichkeiten
  • Nachvollziehbarkeit und Belegbarkeit von Forschungsergebnissen
  • kollaboratives Arbeiten möglich mit individuellen Zugriffsrechten
  • Vernetzte digitale Forschungsumgebung
  • Nachnutzbarkeit der Daten, z.B. im Rahmen einer KI gesteuerten Auswertung
  • Vorbereitung der Publikation und Langzeitarchivierung von Forschungsdaten

ELN Test, Auswahl und Support

Das CDI betreibt für die Forschenden verschiedene ELN-Instanzen auf Basis von Open Source Software (derzeit NOMAD Oasis, eLab FTW und openBIS). Um den Einstieg zu erleichtern, bietet das CDI Beratung und Unterstützung für die Planung und die Einarbeitung. Zudem besteht die Möglichkeit, die ELNs unverbindlich zu testen und so das individuell geeignete Produkt zu finden. Im Produktivbetrieb übernimmt das CDI in Kooperation mit dem RRZE die Administration der ELNs (Installation, Backups, Updates, …). Wir freuen uns über Ihre Anfrage an forschungsdaten@fau.de oder direkt beim ELN Fachpersonal der CDI über cdi-eln-support@fau.de

Aspekte der Entscheidungsfindung

  • Funktionalität: Welche Funktionen eines ELN werden benötigt (beispielsweise integrierter Terminkalender, die Möglichkeit Einträge mit einem Zeitstempel zu versehen, integriertes Laboratory Inventory Management System (LIMS), automatisierte Befüllung von Schnittstellen usw.)
  • Kosten: Wieviel kostet ein ELN initial und was sind die laufenden Kosten?
  • Langfristigkeit: Insbesondere bei kommerzieller Software ist zu bedenken, dass der Anbieter sein Preismodell ändern kann und man u.U. nach einigen Jahren mit deutlich steigenden Kosten konfrontiert ist. Zudem besteht die Möglichkeit der Geschäftsaufgabe oder der Insolvenz des Anbieters.
  • Speicher: Wieviel Speicherplatz steht zur Verfügung und lässt sich der Speicherplatz bei Bedarf erweitern
  • extern gehostet vs. Vor-Ort: Vor-Ort bedeutet mehr Aufwand (Installation, Wartung, Updates, …), aber auch bessere Kontrolle darüber, wer auf die Daten zugreifen kann. Zudem lässt sich bei Vor-Ort gehosteten Lösungen i.A. der Speicherplatz bei Bedarf entsprechend erweitern, bei extern gehosteten Lösungen muss mit dem jeweiligen Anbieter verhandelt werden. Zusätzlich besteht bei extern gehosteten Lösungen die Gefahr, dass der Anbieter pleite geht und damit der Zugriff auf die Daten nicht mehr möglich ist.
  • Open Source: Bei Open Source Lösungen besteht die Garantie, dass die Software für immer zu den genannten Bedingungen (zum Zeitpunkt des Herunterladens) genutzt werden kann, dh. auch wenn die Weiterentwicklung der Software durch die ursprünglichen Entwickler eingestellt wird, kann die Software weiterverwendet werden. Zudem ist bei Open Source Software der Quellcode öffentlich zugänglich, die Software kann also ggf. an die eigenen Bedürfnisse angepasst bzw. erweitert werden
  • Komplexität / Lernaufwand: Wie leicht ist es für Nutzer/-innen den Umgang mit dem ELN zu lernen? Akzeptieren Forschende den Umstieg auf das ELN?
  • Support: Wie gut ist die Unterstützung bei aufkommenden Fragen/Problemen? Gibt es Hilfe bei der Einrichtung des Systems? Gibt es Tutorials um den Umgang mit dem System zu lernen?
  • Konfigurierbarkeit: Wie gut kann ich das ELN auf meine individuellen Bedürfnisse anpassen? Was kann konfiguriert werden? Unterstützt das System bei Bedarf auch komplexe Metadaten-Modelle?
  • Auswertbarkeit: Wie strukturiert werden Daten abgelegt? Erlaubt die Ablagestruktur der Daten eine automatische Auswertung?
  • Kompatibilität: Kompatibilität mit externen Kooperationspartnern/Universitäten und deren ELNs (können beispielsweise Elemente exportiert und in anderen ELNs wieder importiert werden, weil in einer Kooperation nicht nur Proben, sondern auch deren “Geschichte” ausgetauscht werden sollen)
  • Exit-Strategie: Wie kann ich die Daten (inkl. aller Verknüpfungen usw.) beim Wechsel von einem ELN-System auf ein anderes exportieren und in das neue System importieren? Ein Export beispielsweise als pdf-Datei ist wahrscheinlich in den meisten Fällen nicht ausreichend.

Eine Liste verfügbarer ELNs ist hier zu finden.

Derzeit von der CDI unterstützte ELN-Software

NOMAD OASIS

  • “structure-first” ELN
  • Dateien basiert, echte Ordnerstruktur bleibt erhalten
  • noch relativ neu, basiert auf dem NOMAD Repository
  • integrierte Werkzeuge, wie z.B. JupyterHub
  • (optional) Datenveröffentlichung über zentrales NOMAD
  • RFC3161 time stamping
  • Datenexport möglich
  • weitere Informationen

eLabFTW

  • “free-text first” ELN
  • Templates mit Tabellen, Feldern, Schritten, etc.
  • Definition zusätzlicher Strukturen via JSON möglich
  • manuelle und automatische “ToDo-List” sidebar
  • integrierter Kalender um Geräte zu buchen
  • RFC3161 and blockchain (Bloxberg.org) timestamping
  • Möglichkeit, Einträge zu signieren
  • Datenexport möglich
  • weitere Informationen

openBIS

openBIS ist ein von der ETH Zürich entwickeltes quelloffenes Datenverwaltungswerkzeug, das den gesamten Datenlebenszyklus von der Projektaufnahme über die Datenproduktion und -analyse bis hin zur Bereitstellung der wissenschaftlichen Daten für die Öffentlichkeit samt Langzeitarchivierung unterstützt.

  • integriertes Inventarmanagement, plate well tracking
  • JupyterHub
  • grafische Darstellung von Verknüpfungen
  • Exportschnittstelle zu Zenodo
  • Datenexport möglich
  • weitere Informationen

WissKI und FAUWissKICloud

WissKI

WissKI ist eine virtuelle Forschungsumgebung, die wissenschaftliches, ortsunabhängiges und kollaboratives Arbeiten mit linked data ermöglicht. Auf Basis einer Ontologie werden die Forschungsdaten semantisch angereichert und in Form von Triples in einem zusammenhängenden Datennetzwerk gespeichert (Graphdatenbank).

Für den Bereich des kulturellen Erbes verfügt die Wissenschaft über eine als ISO-Standard anerkannte Ontologie, das CIDOC Conceptual Reference Model, welche als Erlangen CRM in OWL implementiert vorliegt. So können Forschungsdaten mit vielfältigen inhaltlichen Bezügen systematisch in einem für das Projekt konzipierten Datenmodell beschrieben und erfasst werden und bleiben mit anderen auf CIDOC CRM basierenden Datenpools vergleichbar. Zudem können Normdaten (GND, Getty AAT, u.a.) durch Adapter integriert sowie DOIs für die Datensätze vergeben werden.

Basierend auf dem Content Management System Drupal bringt der Einsatz von WissKI direkt die Möglichkeit eines Webauftritts und Rechtemanagements mit und kann so als Arbeitsplattform und gleichzeitig offene Forschungsumgebung gestaltet werden. Technische Standards wie die Verwendung von RDF und OWL gewährleisten die Interoperabilität der Daten.

FAUWissKICloud

Die FAUWissKICloud hat eigens den Zweck die WissKI-Systeme der FAU zu hosten und zu warten. Unter der Obhut des RRZE auf Hardware-Ebene managt das CDI die Software-Ebene des Servers. Mithilfe der WissKI-Distillery werden die WissKIs systemübergreifend gewartet und mit Updates versorgt.

Durch das Abbilden spezifischer und komplexer Zusammenhänge mithilfe von Semantic-Web-Technologien ist die Open-Source-Software WissKI einschließlich betreutem Serverplatz auf der FAUWissKICloud besonders attraktiv für geisteswissenschaftliche Projekte. Das CDI bietet Unterstützung in Form von Beratung und Service in der Antragsphase, beim Erstellen des Datenmodells, beim Aufsetzen, Einrichten und Betrieb der WissKI-Instanz, beim Hosten des Systems und bei der Langzeitarchivierung.

Antragsberatung

An dieser Stelle finden Sie demnächst weitere Informationen über die Antragsberatung durch das CDI. Haben Sie jetzt Fragen zum FDM oder benötigen Unterstützung? Schreiben Sie bitte an forschungsdaten@fau.de.

 

Datenmanagementplan DMP

...

FDM Checkliste

Versionsverwaltung für Texte und Software

Um eine transparente Verfolgung von Änderungen an Texten und Software zu gewährleisten, werden Versionverwaltungssysteme  eingesetzt. An der FAU betreibt das RRZE dazu zwei gitlab-Instanzen, welche das git-Protokoll unterstützen und weitere Features zur Zusammenarbeit wie Bugtracking, Meilensteine, usw. anbieten:

Die jeweiligen Projektinhalte können sowohl öffentlich angezeigt werden als auch nur für definierte Personen zugänglich sein.

Beide Systeme sollen im Rahmen der FAUDataCloud in einen Regelbetrieb überführt werden und dauerhaft Software und Dokumentation als Forschungsdaten sichern.