Forschungsdatenmanagement

Der Umgang mit Forschungsdaten ist nahezu so individuell wie Forschungsvorhaben selbst. Neben der Organisation grundlegender Infrastruktur (wie der Zugriff auf Speichermöglichkeiten) spielt vor allem ein logischer und nachvollziehbarer Umgang mit den Datensätzen selbst die maßgebliche Rolle.

Es können an allen Punkten des Datenlebenszyklus strukturierte Maßnahmen ergriffen werden, um die wissenschaftliche Aussagekraft von Forschungsdaten zu erhalten, deren Zugänglichkeit durch Dritte für Auswertung und Analyse zu bewahren und die Nachweiskette zu sichern.

Erste Schritte

Im Fokus steht dabei immer die Nachnutzbarkeit durch Dritte. Jedoch helfen alle beigefügten Informationen auch den Beteiligten selbst bei der nachhaltigen Nutzung der eigenen Daten. Am Beginn steht immer eine Inventur der vorhandenen bzw. der vermutlich erzeugten Daten.

  • Welche Datenformate werden benutzt?
  • Welche Geräte erzeugen Daten(-ströme)?
  • Wo erfolgt die Speicherung?
  • Wer hat auf welche Daten Zugriff?
  • Unterliegen manche Daten besonderem Schutz?
  • Welches Datenvolumen muss verwaltet werden?
  • Wie erfolgt der Datenaustausch in der Gruppe und nach außerhalb?
  • Wie können Datensätze veröffentlicht werden?

Bedingungen

Viele Mittelgeber, allen voran DFG und EU, fordern die Forschenden auf, möglichst viele Datensätze unter den Regelungen der FAIR-Prinzipien zu veröffentlichen. Ausgeschrieben bedeutet dies:

  • F = findable (kurz: ich oder eine Maschine kann Datensätze über Suchmaschinen leicht finden)
  • A = accessible (kurz: es gibt Informationen darüber, wie ich oder eine Maschine auf die Datensätze zugreifen kann)
  • I = interoperable (kurz: Verwendung von Standards)
  • R = resusable (kurz: klare Nutzungsrechte)

Nähere Erläuterungen zu den einzelnen Bereichen sind auf forschungsdaten.org nachzulesen. Besonderes Augenmerk aus Sicht der Forschenden muss auf interoperable gelegt werden. In diesem Bereich müssen gemeinsame Standards, abgestimmte Workflows, Regelungen für die Annotation der Daten und eine möglichst breite Erfassung von ergänzenden Daten (rich meta-data) zumindest im Fach, besser noch fachübergreifend, entwickelt, angepasst und benutzt werden. In Deutschland fördert die DFG verschiedene Konsortien innerhalb der Nationalen Forschungsdaten-Infrastruktur (NFDI) zur Entwicklung dieser Regelungen. Verschiedene Fachgesellschaften definieren bereits jetzt umfangreiche Kataloge für das Forschungsdatenmanagement. Aus universitärer Sicht ist die Sicherstellung der dauerhaften Datenspeicherung eine Herausforderung, die Datensätze sollten über einen Zeitraum von mindestens 10 Jahren nach Projektende verfügbar gehalten werden.

FDM an der FAU

An der FAU wird das Forschungsdatenmanagement flankiert durch