FDM im Forschungsprozess

Der Forschungsdatenlebenszyklus ist ein Modell, welches die verschiedenen Stationen darstellt, welche Forschungsdaten während eines Forschungsprozesses durchlaufen. Hierbei handelt es sich um eine idealisierte Darstellung, da die verschiedenen Schritte oft eng miteinander verknüpft sind und sich teilweise überschneiden.

 

Forschungsdatenlebenzyklus

 

Planen

Bereits bei der Planung eines Forschungsvorhabens bietet es sich an festzulegen welche Daten in welchem Umfang erstellt werden. Zu diesem Zeitpunkt werden idealerweise rechtliche Anforderungen zum Datenschutz und Urheberrecht frühzeitig identifiziert und können geklärt werden. Insbesondere bei personenbezogenen Daten ist es wichtig zu klären, ob diese zur Nachnutzung freigegeben wurden bzw. freigegeben werden sollen.

Diese und weitere Informationen werden in einem Datenmanagementplan erfasst, der von einigen Forschungsförderern gefordert wird.

Sammeln

Beim Sammeln der Daten ist es wichtig, diese in einem einheitlichen Schema zu benennen und zu sortieren. Bei der Beschreibung von Daten sind Metadaten ein wichtiger Bestandteil, um deren Auffindbarkeit zu verbessern und Nachnutzbarkeit zu ermöglichen. Metadaten sind auch ein Teil zur Erfüllung der FAIR Prinzipen für Daten (siehe "Nachnutzen").

Das Sammeln von Daten, kann durch ein Elektronisches Laborbuch (ELB) erleichtert werden, indem Daten mit ihren Metadaten in der Zusammenarbeit mit anderen Wissenschaftler*innen strukturiert und gespeichert werden können.

Um Datenverlust zu vermeiden, sollten Backups der Daten erstellt werden. Für Backups bietet die 3-2-1-Regel eine Orientierung. Diese beschreibt, dass es drei Kopien einer Datei geben sollte, welche auf zwei verschiedenen Speichermedien abgelegt sind, wobei sich ein Speichermedium extern befindet. Die Datenverarbeitungszentrale (DVZ) der HSBI bietet Netzwerklaufwerke an, die regelmäßig gesichert werden. Es gibt persönliche Speicherbereiche und Netzwerklaufwerke für Nutzergruppen.

Analysieren

Um Forschungsergebnisse zu gewinnen, werden Forschungsdaten analysiert und interpretiert. Auch im Analyseprozess bieten die Hinweise zur Beschreibung und Sicherung von Daten aus dem Schritt "Sammeln" eine Orientierung.

Archivieren

Bei der Archivierung handelt es sich um eine langfristige Speicherung von unveränderbaren Daten, nachdem die Daten gesammelt und analysiert wurden. Die Daten, welche archiviert werden sollen, müssen in geeignete Dateiformate migriert werden. Geeignete Formate sind hierbei offene Formate, welche die langfristige Nutzbarkeit ermöglichen. Des Weiteren sollten die Dateien nicht nur von einem Programm oder Gerät geöffnet werden können, sondern von mehreren. Viele Drittmittelgeber fordern eine Archivierungsdauer von 5 bis 10 Jahren nach Projektende.

Die Archivierung kann auch nach dem Publizieren der Daten durchgeführt werden.

Publizieren

Eine Veröffentlichung der Forschungsdaten kann zusätzlich zum Artikel z.B. in einem Datenrepositorium stattfinden. Dort wird die Datenpublikation mit Metadaten zur besseren Auffindbarkeit beschrieben und mit einem Persistent Identifier, z.B. DOI, versehen, um die Zitierbarkeit zu gewährleisten.

Für die Veröffentlichung sollte eine Lizenz (z.B. CC Lizenz) vergeben werden, die möglichst offen ist, damit die Daten nachgenutzt werden können. In einigen Repositorien besteht auch die Möglichkeit den Zugriff einzuschränken.

Nachnutzen

Der letzte Schritt im Datenlebenszyklus betrifft die Nachnutzung von Daten. Wurden Daten unter Beachtung der FAIR Prinzipien veröffentlicht können sie leicht in Repositorien (siehe "Publizieren") gefunden werden. Sie besagen, dass Daten Findable (auffindbar), Accessible (zugänglich), Interoberable (kompatibel) und Reusable (nachnutzbar) sein sollen. Die Nachnutzung von Daten überschneidet sich mit dem Schritt der Planung, da beispielsweise rechtliche Rahmenbedingungen, welche die Nachnutzung eines Datensatzes betreffen, zu Beginn geklärt werden sollten.