Wikibase4Research: Wissensdaten einfach verwalten, teilen und visualisieren

Wikibase4Research ist eine neu entwickelte Lösung des Open Science Labs der TIB, die den Einsatz von Mediawiki-Software für Wissensdatenbanken wie Wikibase stark vereinfacht und speziell auf die Bedürfnisse akademischer Projekte zugeschnitten ist. Wikibase4Research übernimmt vollautomatisch die Installation der gewünschten Software, egal ob Mediawiki, Wikibase, Semantic Mediawiki oder sogar eine Kombination dieser Komponenten. Das System richtet sich an Wissenschaftler:innen, die komplexe Datenbanken und Wissensplattformen aufbauen möchten, ohne tief in technische Details einsteigen zu müssen.

Vereinfachte Installation und umfassende Funktionen

Eine der größten Hürden bei der Arbeit mit Wikibase war bisher die komplizierte Installation und Konfiguration. Wikibase4Research löst dieses Problem, indem es eine vorkonfigurierte Docker-Pipeline bereitstellt, die es ermöglicht, eine vollständige Wikibase-Instanz in wenigen Minuten einzurichten. Dabei werden nicht nur die Wiki-Plattform selbst, sondern auch relevante Dienste wie SPARQL-Endpunkte, OpenRefine-Reconciliation-Service und Elasticsearch automatisch installiert. Diese Dienste sind entscheidend für die Arbeit mit strukturierten Daten, deren Abfrage und Analyse. Zusätzlich kann Wikibase4Research das Wiki automatisiert mit Daten befüllen, wie Bilder, Wikiseiten und Wikibase Items. Dieser automatisierte Datenimport spart erheblich Zeit und erleichtert auch den Wechsel von bestehenden Wikibase-Instanzen zu Wikibase4Research, da manuelle Importe entfallen.

Im Vergleich zu festen Installationspipelines, die eine fest definierte Softwareumgebung bereitstellen, bietet Wikibase4Research eine flexible Konfiguration. Forscher können aus vordefinierten Presets wählen oder eigene Einstellungen vornehmen, um die Softwareumgebung optimal an ihre Bedürfnisse anzupassen. Dies ist besonders wertvoll, wenn spezielle Erweiterungen oder Funktionen benötigt werden, die in einer festen Pipeline nicht vorgesehen sind. Diese Flexibilität ermöglicht es den Nutzern, ihre Arbeitsumgebung effizient und präzise zu gestalten, was die Produktivität und Genauigkeit ihrer Forschungsarbeit erhöht.

Technologische Neuerungen: SemanticWikibase

Ein weiteres bedeutendes Feature von Wikibase4Research ist die Kompatibilität und Weiterentwicklung der Open-Source-Technologie SemanticWikibase. Diese Erweiterung kombiniert die semantischen Fähigkeiten von SemanticMediaWiki mit der strukturierten Datenverwaltung von Wikibase. Vor der Veröffentlichung von Wikibase4Research war SemanticWikibase als Prototyp auf einer älteren MediaWiki-Version verfügbar. Mit der neuen Software steht diese Technologie nun in einer stabilen und modernen Umgebung zur Verfügung und unterstützt nun zusätzliche wichtige Datentypen des Wikibase Datenmodells wie zum Beispiel Qualifier. Diese Neuerung eröffnet Forschenden neue Möglichkeiten für die semantische Datenmodellierung und Wissensrepräsentation und ist ein perfektes Beispiel für die Vorteile der Arbeit innerhalb einer etablierten Open-Source-Software-Community.

Während Wikibase vor allem auf die strukturierte Erfassung und kollaborative Verwaltung von Daten ausgelegt ist, bietet Semantic MediaWiki (SMW) umfangreiche Möglichkeiten, diese Daten im Wiki zu visualisieren und für die Nutzer:innen zugänglich zu machen. SMW verfügt hierzu über eine Vielzahl von in das Wiki integrierte Visualisierungsoptionen, die weit über das hinausgehen, was in einer reinen Wikibase-Umgebung möglich ist. Dazu gehören unter anderem:

  • Karten: Geografische Daten können auf interaktiven Karten dargestellt werden.
  • Zeitstrahlen: Ereignisse oder Objekte können chronologisch auf Zeitachsen visualisiert werden, was einen Überblick über historische Entwicklungen oder Projektverläufe ermöglicht.
  • Bildergalerien: Bilder können übersichtlich in Galerien präsentiert und auch interaktiv annotiert werden, um visuelle Daten eindrucksvoll darzustellen.
  • Dynamische Abfragen: SMW ermöglicht es, komplexe Datenabfragen durchzuführen und die Ergebnisse in Tabellen, Listen oder Diagrammen darzustellen. Diese Abfragen können auch dynamisch sein, das heißt, sie passen sich automatisch an neue Daten an.

Diese erweiterten Visualisierungsoptionen machen es einfacher, die in Wikibase gespeicherten Daten anschaulich und verständlich zu präsentieren, was auch das Datenmanagement vereinfacht. Gleichzeitig kann auch die Dateneingabe durch angepasste Webformulare vereinfacht werden. Dies ist zum Beispiel besonders für community-research Projekte interessant, deren Editor:innen ggf. noch keine Vorkenntnisse mit der Handhabung des Wikibase Datenmodells oder der Verwendung der SPARQL Abfragesprache haben. 

Einsatz in aktuellen Forschungsprojekten

Die Entwicklung von Wikibase4Research ist das Ergebnis der Arbeit des Open Science Labs innerhalb des NFDI4Culture Konsortiums in Zusammenarbeit mit dem FIZ Karlsruhe. Die Weiterentwicklung von SemanticWikibase basiert auf der Kooperation mit der Akademie der Wissenschaften in Mainz sowie der AG digitale Philosophie am Projekt PhiWiki. 

Wikibase4Research wird bereits erfolgreich in verschiedenen Forschungsprojekten eingesetzt. Hierzu zählen unter anderem eine Zusammenarbeit mit Semantic Climate, das sich mit der semantischen Modellierung des Weltklimaberichts beschäftigt, sowie eine Glossar-Erstellung in Zusammenarbeit mit dem Co-Site Projekt der TH Köln. Auch das Projekt Herrenhäuser des Ostseeraums, das sich mit der Erfassung von Architektur- und historischen Daten über Herrenhäuser befasst, nutzt Wikibase4Research für die Datenstukturierung und Visualisierung.

Wikibase4Research bietet Forschenden ein mächtiges Werkzeug, um ihre Daten effizient zu verwalten, zu analysieren und zu visualisieren. Durch die einfache Installation, die flexible Konfiguration und die Integration von fortschrittlichen Technologien und Diensten erleichtert es die Arbeit an komplexen Projekten erheblich. Mit den umfangreichen Visualisierungsoptionen von Semantic MediaWiki und der Möglichkeit zum automatisierten Datenimport ist Wikibase4Research ein wertvolles Werkzeug für die digitale Forschung. Das Open Science Lab plant, auch in Zukunft Kompetenzen im Bereich des Wikibase-Ökosystems zu bündeln und entwickelt neben Wikibase4Research auch weitere kompatible Werkzeuge auf Wikibase-Basis. Hierzu gehören zum Beispiel SemantikKompakkt für die wikibase-basierte Annotation von 3D- und Mediendaten und CPS für die Erstellung von Publikationen auf Basis von Wikibase. Auch das Annotationswerkzeug ANTELOPE wird für die integration in das Wikibase Framework vorbereitet. 

Ist Software Entwickler am Open Science Lab der Technischen Informationsbibliothek (TIB). Er entwickelt Werkzeuge für semantische Wissensysteme und Linked Open Data.