AP9 Forschungsdatenmanagement

Lead: Universität Duisburg-Essen, Dr. Rehwald

Eines der größten Hindernisse bei der Weiterentwicklung und Umsetzung von THz-Technologien ist die fehlende gemeinsame Datenbasis. Das Verfügbarmachen von Forschungsdaten ist deswegen die zentrale Aufgabenstellung für AP9. Gerade bezüglich der Weiterentwicklung und der Beteiligung an weiterführenden Vorhaben auf Ebene des BMBF (Zukunftscluster), der DFG (SFB/TRR und auch Exzellenzcluster) und der EU ist der Aufbau eines Forschungsdatenraums ein zentrales Schlüsselelement. Hierfür müssen Messdaten nachvollziehbar und im Rahmen der Open-Science Strategie unentgeltlich Forschenden auch außerhalb des Netzwerkes verfügbar gemacht werden. Forschungsdaten sind dabei aber auch immer ein ökonomischer Faktor und für die langfristige Finanzierung wichtig. Insoweit müssen Doppelstrategien entwickelt werden, zum Beispiel durch Block-Chain Technologien oder Patentportfolios, die einerseits einen freien Zugang für den wissenschaftlichen Bereich ermöglichen und andererseits eine industrielle Verwertung für die Netzwerkpartner erlauben. Daraus ergeben sich drei zu implementierende Säulen eines Terahertz-Datenraums:

 

Grundlegend ist eine technische Infrastruktur zur strukturierten Ablage unterschiedlicher Datentypen, die eine Archivfunktion, regulierten Datenaustausch und flexiblen Datenzugriff über Schnittstellen (APIs) verbindet. Obwohl diese Anforderungen im Grunde universell und nicht auf eine Forschungsdisziplin beschränkt sind, existieren hierfür bislang keine fertigen Lösungen, sondern sie sind Gegenstand sowohl lokaler Entwicklungen als auch Desiderat der Nationalen Forschungsdateninfrastruktur (NFDI). An der RUB und UDE werden derzeit die nötigen Bausteine einer FDM-Infrastruktur etabliert und zur Verfügung gestellt. Die Zusammenführung der Komponenten zu einem verbundenen Datenraum und dessen Öffnung für die Community werden im Rahmen von terahertz.NRW umgesetzt und können auf prototypischen Vorarbeiten des SFB MARIE zu den Anwendungen Dataverse und Nextcloud aufsetzen.

 

Die Entwicklung einer geeigneten Datenstruktur und Ontologie mit einem entsprechenden Metadatenschema ist essenziell für den Terahertz-Datenraum, der Materialcharakterisierungen, Algorithmen und Komponentendesign abdecken und semantisch miteinander verknüpfen wird. Im Hinblick auf die spätere Community-weite Nutzung des THz-Datenraums ist die Einbettung der Metadaten in Standards der Ingenieurswissenschaften unumgänglich und wird daher in Kooperation mit dem NFDI-Konsortium NFDI4Ing entwickelt werden. Ausgehend von den beschriebenen Demonstratoren werden Datensammlungen und Datenstrukturen entwickelt, die nach dem Vorbild von RO-Crate [SOI/2022] passgenau Research Objects für die THz-Forschung definieren und ablegen.

 

Gerade im Bereich des Komponenten- und Chipdesigns setzen patentrechtliche und nutzungsrechtliche Aspekte klare Leitplanken für Nachnutzungsszenarien und Zugriffsregulierung des Datenraums. Eine ausdifferenzierte Data Policy ist daher ebenso notwendig wie neue Lösungen für smarte Datenformate, mit denen Komponenten und deren Charakterisierungen zwar katalogisiert werden können, patentrelevante Informationen indes unzugänglich und geschützt verbleiben können.