Workshop zum Open Research Knowledge Graph in der TIB

read this article in English

 

Am 20. März 2018 veranstaltete die TIB einen Expertenworkshop zur Realisierung eines Open Research Knowledge Graph (ORKG).

Ziel des Workshops war es, wie im aktuellen Positionspapier der TIB beschrieben, Anforderungen, die Rahmenarchitektur und erste Schritte zur Implementierung einer offenen Wissensgraphen-Infrastruktur für die semantische Darstellung der Inhalte wissenschaftlicher Publikationen zu diskutieren.

Insgesamt nahmen mehr als 40 Teilnehmer aus den verschiedensten Organisationen teil, darunter GESIS – Leibniz-Institut für Sozialwissenschaften, ZB MED – Informationszentrum Lebenswissenschaften, FIZ Karlsruhe – Leibniz-Institut für Informationsinfrastruktur, das Leibniz-Zentrum für Psychologische Information und Dokumentation (ZPID), die Universität Münster, die Friedrich-Alexander-Universität Erlangen-Nürnberg, das Deutsche Forschungszentrum für Künstliche Intelligenz (DFKI), die Universität Paderborn, das Forschungszentrum L3S, die Technische Universität Chemnitz, das Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme, die Forschungsgruppe „Agile Knowledge Engineering and Semantic Web (AKSW)“ der Universität Leipzig und die Universität Bonn.

Nach kurzen Vorträgen wurde der Nachmittag in parallelen Arbeitsgruppen organisiert, die konkrete Themen wie folgt bearbeiteten:

  • ORKG-Kernontologie und Konzeption eines Forschungsbeitrags: Diese Arbeitsgruppe diskutierte die relevanten Komponenten von Forschungsbeiträgen und mögliche Ansätze zur Konzeption von Forschungsprozessen und deren Ergebnissen mit dem Ziel, ein Datenmodell zu entwickeln, auf dem der ORKG basieren kann. Die Gruppe hat sich darauf geeinigt, eine bestehende Ontologie wiederzuverwenden und gemeinsam zu einer geeigneten ORKG-Kernontologie zu entwickeln, die an den Zielen und Anwendungsfällen des ORKG ausgerichtet wird. Die Arbeitsgruppe untersuchte auch verschiedene Optionen für eine Governance-Strategie im Hinblick auf eine weitere Entwicklung der Kernontologie auf der Grundlage der Eingaben und Rückmeldungen von Anwendern aus den verschiedenen Forschungsbereichen, die wir ansprechen wollen.
  • Architecture, Storage, REST API: Diese Arbeitsgruppe diskutierte verschiedene Aspekte der Technologie, die derzeit für die Implementierung von Graphen verwendet wird, wie zum Beispiel Linked Property Graphs (LPGs) und RDF-Triple-Stores. Das Thema Speicherung, Skalierbarkeit und die Entwicklung eines allgemeinen Datenmodells wurden diskutiert und verschiedene Optionen bewertet. Auch die effiziente Speicherung von Herkunftsangaben (Provenance) wurde untersucht. Die Hauptdiskussion drehte sich um den Export von RDF, wenn LPG auf der Speicherseite verwendet wird, sowie um die Vor- und Nachteile dieses Ansatzes.
  • Frontend und ORKG-Benutzeroberfläche: Eine Schlüsselbotschaft dieser Arbeitsgruppe war, dass Visualisierung einen Zweck hat, also eine Benutzeroberflächen für ORKG einen konkreten Zweck adressieren müssen. Die Arbeitsgruppe diskutierte drei User-Interface-Typen (UI), nämlich das Submission UI, das Visualization UI und das Curation UI. Die Submission UI unterstützt die Versorgung des ORKG mit Fakten, und die Arbeitsgruppe diskutierte, wie dies für die Anwender einfach zu gestalten ist, wie sie sich in bestehende Systeme (zum Beispiel Paper Submission Systeme) integrieren lässt und wie sie die Qualität der eingereichten Fakten verbessern kann (zum Beispiel durch Integration in den Review-Prozess). Das Visualisierungs-UI unterstützt die Erforschung und Navigation von ORKG-Fakten. Die Arbeitsgruppe schlug vor, dass die Infrastruktur die Benutzerauthentifizierung nutzen sollte, um den Benutzer und seine Präferenzen einzubeziehen. Schließlich soll das Curation UI Experten in der Qualitätssicherung und der allgemeinen Kuratierung des ORKG unterstützen.
  • Pilotanwendungen, Testbeds und Use Cases, Kooperation und Governance: Diese Gruppe diskutierte Use Cases und Querschnittsthemen. Als Pilot-Domains erscheinen Informatik (insbesondere Semantic Web-Forschung) und Mathematik aufgrund des vorhandenen Bewusstseins für semantische und konzeptionelle Strukturen vielversprechend. Die Lizenz für ORKG-Vertretungen sollte so offen wie möglich sein, aber gleichzeitig die Nachhaltigkeit der Infrastruktur sicherstellen. Da es derzeit kein eigenes Förderprogramm gibt, muss die Entwicklung der ORKG-Infrastruktur in bestehende Projekte und Initiativen, wie zum Beispiel Nationale Forschungsdateninitiativen, integriert werden. Für die Governance sollte irgendwann eine eigenständige rechtliche Struktur geschaffen werden, die TIB sollte aber vorerst der Verwalter der entstehenden ORKG-Infrastruktur sein.

Der Workshop warf mehr Fragen auf, als er beantwortete. Dies ist in dieser frühen Phase des Projekts sicherlich zu erwarten. Der Workshop zeigte, wie wichtig es ist, einen Wissensgraph für Forschung offen zu entwickeln. Neben der Entwicklung eines ersten Prototyps wird es daher für die TIB von entscheidender Bedeutung sein, Stakeholder, einschließlich Partnerbibliotheken, einzubeziehen. Die Community plant die Organisation und Kommunikation über eine Mailingliste.

Im Herbst ist im Rahmen der DILS-Konferenz ein weiterer ORKG-Workshop geplant.

Einen weiteren Workshop-Bericht von Ricardo Usbeck von DICE @ Uni Paderborn finden Sie hier.