K10plus Knowledge Graph
An dieser Stelle entsteht ein Handbuch für die Verwaltung und Nutzung des K10plus Knowledge Graph.
Der Knowledge Graph ist als Labeled Property Graph umgesetzt (siehe Einführung in Property Graphen). Eine Variante in RDF ist für später angedacht.
Dependencies
- pip install requests
- https://github.com/pg-format/pgraphs/
Nutzung
Erstelle .pg und .csv Dateien
pgraphs muss wie in https://github.com/pg-format/pgraphs/ beschrieben installiert sein. Mit make wird ein Property-Graph mit erstellt und daraus CSV-Dateien. Das erste mal kann dies ein paar Minuten dauern, da kxp-subjects sehr groß ist.
In some some_subjects.pg und den daraus entstandenen CSV-Dateien sind nur die ersten 4000000 Zeilen aus kxp-subjects.pg, da pgraphs nicht mit größeren Dateien umgehen kann. Mit den CSV-Dateien wird ein Labeled Property Graph in Neo4j erstellt.
Datenmodell
# Knoten
## Publikation
Title :title
ppn: string
## Redirects (umgelenkte PPNs)
Redirect :redirect
from: string # PPN
ppn: string
TODO: existiert noch nicht
## Konzept (Schlagwort)
Concept :concept
zusätzliche Label für die einzelnen Vokabulare (:bk :rvk ...)
notation: string
# Kanten
Title -> Concept :subject # Sacherschließung
Concept -> Concept :broader # Hierarchie
Concept -> Concept :mapping # Sacherschließung mit Cocoda
## Mapping
Mapping :mapping
uri: string
relation: string