K10plus Knowledge Graph
An dieser Stelle entsteht ein Handbuch für die Verwaltung und Nutzung des K10plus Knowledge Graph.
Der Knowledge Graph ist als Labeled Property Graph umgesetzt (siehe Einführung in Property Graphen). Eine Variante in RDF ist für später angedacht.
Dependencies
- pip install requests
- https://github.com/pg-format/pgraphs/
Nutzung
Erstelle .pg und .csv Dateien
pgraphs muss wie in https://github.com/pg-format/pgraphs/
beschrieben installiert sein. Mit make
wird ein Property-Graph mit erstellt und daraus CSV-Dateien. Das erste mal kann dies ein paar Minuten dauern, da kxp-subjects sehr groß ist.
In some some_subjects.pg
und den daraus entstandenen CSV-Dateien sind nur die ersten 4000000 Zeilen aus kxp-subjects.pg
, da pgraphs nicht mit größeren Dateien umgehen kann. Mit den CSV-Dateien wird ein Labeled Property Graph in Neo4j erstellt.
Datenmodell
# Knoten
## Publikation
:title
Title ppn: string
## Redirects (umgelenkte PPNs)
:redirect
Redirect from: string # PPN
ppn: string
TODO: existiert noch nicht
## Konzept (Schlagwort)
:concept
Concept zusätzliche Label für die einzelnen Vokabulare (:bk :rvk ...)
notation: string
# Kanten
-> Concept :subject # Sacherschließung
Title
-> Concept :broader # Hierarchie
Concept
-> Concept :mapping # Sacherschließung mit Cocoda
Concept
## Mapping
:mapping
Mapping uri: string
relation: string