K10plus Knowledge Graph

An dieser Stelle entsteht ein Handbuch für die Verwaltung und Nutzung des K10plus Knowledge Graph.

Der Knowledge Graph ist als Labeled Property Graph umgesetzt (siehe Einführung in Property Graphen). Eine Variante in RDF ist für später angedacht.

Dependencies

  • pip install requests
  • https://github.com/pg-format/pgraphs/

Nutzung

Erstelle .pg und .csv Dateien

pgraphs muss wie in https://github.com/pg-format/pgraphs/ beschrieben installiert sein. Mit make wird ein Property-Graph mit erstellt und daraus CSV-Dateien. Das erste mal kann dies ein paar Minuten dauern, da kxp-subjects sehr groß ist.
In some some_subjects.pg und den daraus entstandenen CSV-Dateien sind nur die ersten 4000000 Zeilen aus kxp-subjects.pg, da pgraphs nicht mit größeren Dateien umgehen kann. Mit den CSV-Dateien wird ein Labeled Property Graph in Neo4j erstellt.

Datenmodell

# Knoten

## Publikation
Title :title
  ppn: string

## Redirects (umgelenkte PPNs)
Redirect :redirect
  from: string # PPN
  ppn: string
  TODO: existiert noch nicht

## Konzept (Schlagwort)
Concept :concept
  zusätzliche Label für die einzelnen Vokabulare (:bk :rvk ...)
  notation: string

# Kanten

Title -> Concept :subject       # Sacherschließung

Concept -> Concept :broader     # Hierarchie

Concept -> Concept :mapping     # Sacherschließung mit Cocoda

## Mapping
Mapping :mapping
  uri: string
  relation: string