Der Hintergrund
DBRepo, öffnet eine externe URL in einem neuen Fenster ist ein Repositorium für Datenbanken, das im Rahmen des vom BMBWF geförderten und kürzlich erfolgreich abgeschlossenen Projektes FAIR Data Austria, öffnet eine externe URL in einem neuen Fenster entwickelt wurde. Das Repositorium unterstützt Forschende dabei, ihre Forschungsdaten auffindbar, zugänglich, interoperabel und wiederverwendbar zu machen. Um dies zu ermöglichen, werden bei der Ablage von Daten Metadaten erzeugt, die sowohl in der Metadaten-Datenbank abgelegt als auch im Suchdienst von DBRepo indexiert werden. Derzeit werden Datenbankinformationen (Name, Beschreibung), Tabelleninformationen (Name, Beschreibung) und Spalteninformationen (Name, Typ, nullable, uniqueness, Primärschlüssel) gespeichert, sowie Metadaten, die erforderlich sind, um einer Datenbank und einem Datensatz einen dauerhaften Identifikator zu geben. Diese (Meta-)Daten sind über eine Wildcard-Suche vom Frontend aus über ein einfaches Textfeld auffindbar.
Dies ist nützlich für eine erste Suche nach interessanten Datensätzen. Derzeit fehlt aber die Implementierung für eine strukturierte Suche, die nicht Teil des FAIR Data Austria Projekts war. Ein Beispiel: Ein Forschender sucht nach Datensätzen, die Ozonmessungen enthalten, unabhängig davon, ob der Datensatz die Begriffe O3, Ozon, Ozone (= Englisch) oder озон (= Ukrainisch) enthält. Wir bezeichnen diese Art der Suche als semantische konzeptbasierte Suche. In ähnlicher Weise sollten Datensätze, die Partikelmessungen enthalten, auffindbar und konvertierbar sein, unabhängig davon, ob die Maßeinheit mg/m3, µg/m3, ppm oder ppb ist. Wir bezeichnen diese Art der Suche als maßeinheitenbasierte Suche.
Der nächste Schritt: die strukturierte Suche
Die Funktionalität von DBRepo soll erweitert werden, um (Meta-)Daten innerhalb von DBRepo durch eine strukturierte Suche auffindbar zu machen, die in der Lage ist, semantische konzeptbasierte Suchanfragen und auf Maßeinheiten basierende Suchanfragen zu verarbeiten. Dies wird den von DBRepo angebotenen Service in zweifacher Hinsicht verbessern:
- Forschende, die in DBRepo gespeicherte qualitativ hochwertige Daten nutzen möchten, können relevante Datensätze finden, die ihrer Suchanfrage entsprechen
- Verglichen mit der bereits vorhandenen Wildcard-Suche werden die Daten in DBRepo besser gefunden.
Eine weitere Aufgabe, die für andere Forschende der TU Wien interessant sein wird, ist das Auffinden von Datensätzen, wenn deren semantisches Konzept und Maßeinheit bekannt ist. Ein Beispiel: Eine Forscherin möchte alle Datensätze aus DBRepo abrufen, die mäßige bodennahe Ozonmessungen im Bereich von 55 ppb bis 70 ppb enthalten. In diesem Fall wird eine Suchanfrage den Suchdienst von DBRepo nutzen, um Ergebnisse in anderen Maßeinheiten abzurufen, wie z.B. bodennahe Ozonmessungen von 118,2 µg/m3 (bei 20°C und 1 atm atmosphärischem Druck). Wir bezeichnen dies als einheitenunabhängige Suche.
Die Ziele
Die Ziele dieses internen Projekts sind:
- Erweiterung der indizierten Metadaten im Suchdienst um semantische Konzepte und Maßeinheiten von Tabellenspalten abzudecken und eine strukturierte Suche durch Facetten zu ermöglichen, die den Nutzern bei der Filterung der Ergebnisse auf der Grundlage von semantischen Konzepten und/oder Maßeinheiten helfen.
- Auf der Grundlage von Punkt 1 werden die Metadaten erweitert, die für jede Spalte gespeichert sind, die Maßeinheiten enthält, um auch die Sammlung von Metadaten zu ermöglichen, die die Konversation zwischen Maßeinheiten verbessern.
- Basierend auf Punkt 1, wird die Suche erweitert, um eine einheitenunabhängige Suche innerhalb der Ontologie der Maßeinheiten zu ermöglichen.
Projektinformationen
Das Projektteam besteht aus:
Der vorgesehene Zeitrahmen für das Projekt beträgt neun Monate. Das bewilligte Budget liegt knapp unter dem Höchstbetrag für .dcall Projekte von 30.0000€.
Weitere Informationen zu DBRepo
Website: https://dbrepo-docs.ossdip.at/, öffnet eine externe URL in einem neuen Fenster
Systembeschreibung: https://doi.org/10.2218/ijdc.v17i1.825, öffnet eine externe URL in einem neuen Fenster
Demo-Instanz: https://dbrepo1.ec.tuwien.ac.at, öffnet eine externe URL in einem neuen Fenster
Sandbox-Instanz: https://dbrepo2.ec.tuwien.ac.at, öffnet eine externe URL in einem neuen Fenster
Kontakt
TU Wien
Zentrum für Forschungsdatenmanagement
Favoritenstraße 16 (DG), 1040 Wien
Twitter: @RDMTUWien