News zum Forschungsdatenmanagement

DBRepo erhält TU Wien-interne Projektförderung

Das Projekt "Structured & Unit Independent Search for DBRepo" ist eines von neun Projekten, die in diesem Jahr von .dcall, einer Initiative zur Förderung der digitalen Transformation an der TU Wien, unterstützt werden.

Graphik mit DBRepo in der Mitte und relevanten Services und Systemen rundherum, jeweils mit Pfeilen in die eine oder andere Richtung verbunden.

DBRepo bietet viele APIs für Datenimport und -export und interagiert mit externen Systemen zur Darstellung und Analyse von Daten

Der Hintergrund

DBRepo, öffnet eine externe URL in einem neuen Fenster ist ein Repositorium für Datenbanken, das im Rahmen des vom BMBWF geförderten und kürzlich erfolgreich abgeschlossenen Projektes FAIR Data Austria, öffnet eine externe URL in einem neuen Fenster entwickelt wurde. Das Repositorium unterstützt Forschende dabei, ihre Forschungsdaten auffindbar, zugänglich, interoperabel und wiederverwendbar zu machen. Um dies zu ermöglichen, werden bei der Ablage von Daten Metadaten erzeugt, die sowohl in der Metadaten-Datenbank abgelegt als auch im Suchdienst von DBRepo indexiert werden. Derzeit werden Datenbankinformationen (Name, Beschreibung), Tabelleninformationen (Name, Beschreibung) und Spalteninformationen (Name, Typ, nullable, uniqueness, Primärschlüssel) gespeichert, sowie Metadaten, die erforderlich sind, um einer Datenbank und einem Datensatz einen dauerhaften Identifikator zu geben. Diese (Meta-)Daten sind über eine Wildcard-Suche vom Frontend aus über ein einfaches Textfeld auffindbar.

Dies ist nützlich für eine erste Suche nach interessanten Datensätzen. Derzeit fehlt aber die Implementierung für eine strukturierte Suche, die nicht Teil des FAIR Data Austria Projekts war. Ein Beispiel: Ein Forschender sucht nach Datensätzen, die Ozonmessungen enthalten, unabhängig davon, ob der Datensatz die Begriffe O3, Ozon, Ozone (= Englisch) oder озон (= Ukrainisch) enthält. Wir bezeichnen diese Art der Suche als semantische konzeptbasierte Suche. In ähnlicher Weise sollten Datensätze, die Partikelmessungen enthalten, auffindbar und konvertierbar sein, unabhängig davon, ob die Maßeinheit mg/m3, µg/m3, ppm oder ppb ist. Wir bezeichnen diese Art der Suche als maßeinheitenbasierte Suche.

Der nächste Schritt: die strukturierte Suche

Die Funktionalität von DBRepo soll erweitert werden, um (Meta-)Daten innerhalb von DBRepo durch eine strukturierte Suche auffindbar zu machen, die in der Lage ist, semantische konzeptbasierte Suchanfragen und auf Maßeinheiten basierende Suchanfragen zu verarbeiten. Dies wird den von DBRepo angebotenen Service in zweifacher Hinsicht verbessern:

  • Forschende, die in DBRepo gespeicherte qualitativ hochwertige Daten nutzen möchten, können relevante Datensätze finden, die ihrer Suchanfrage entsprechen
  • Verglichen mit der bereits vorhandenen Wildcard-Suche werden die Daten in DBRepo besser gefunden.

Eine weitere Aufgabe, die für andere Forschende der TU Wien interessant sein wird, ist das Auffinden von Datensätzen, wenn deren semantisches Konzept und Maßeinheit bekannt ist. Ein Beispiel: Eine Forscherin möchte alle Datensätze aus DBRepo abrufen, die mäßige bodennahe Ozonmessungen im Bereich von 55 ppb bis 70 ppb enthalten. In diesem Fall wird eine Suchanfrage den Suchdienst von DBRepo nutzen, um Ergebnisse in anderen Maßeinheiten abzurufen, wie z.B. bodennahe Ozonmessungen von 118,2 µg/m3 (bei 20°C und 1 atm atmosphärischem Druck). Wir bezeichnen dies als einheitenunabhängige Suche.

Die Ziele

Die Ziele dieses internen Projekts sind:

  1. Erweiterung der indizierten Metadaten im Suchdienst um semantische Konzepte und Maßeinheiten von Tabellenspalten abzudecken und eine strukturierte Suche durch Facetten zu ermöglichen, die den Nutzern bei der Filterung der Ergebnisse auf der Grundlage von semantischen Konzepten und/oder Maßeinheiten helfen.
  2. Auf der Grundlage von Punkt 1 werden die Metadaten erweitert, die für jede Spalte gespeichert sind, die Maßeinheiten enthält, um auch die Sammlung von Metadaten zu ermöglichen, die die Konversation zwischen Maßeinheiten verbessern.
  3. Basierend auf Punkt 1, wird die Suche erweitert, um eine einheitenunabhängige Suche innerhalb der Ontologie der Maßeinheiten zu ermöglichen.

Projektinformationen

Das Projektteam besteht aus:

Der vorgesehene Zeitrahmen für das Projekt beträgt neun Monate. Das bewilligte Budget liegt knapp unter dem Höchstbetrag für .dcall Projekte von 30.0000€.

Weitere Informationen zu DBRepo

Website: https://dbrepo-docs.ossdip.at/, öffnet eine externe URL in einem neuen Fenster

Systembeschreibung: https://doi.org/10.2218/ijdc.v17i1.825, öffnet eine externe URL in einem neuen Fenster

Demo-Instanz: https://dbrepo1.ec.tuwien.ac.at, öffnet eine externe URL in einem neuen Fenster

Sandbox-Instanz: https://dbrepo2.ec.tuwien.ac.at, öffnet eine externe URL in einem neuen Fenster

Kontakt

TU Wien
Zentrum für Forschungsdatenmanagement
Favoritenstraße 16 (DG), 1040 Wien

research.data@tuwien.ac.at

Twitter: @RDMTUWien