Fondation SAPA : un graphe de données liées au coeur des archives

(Graphes de connaissances et archives, épisode 3) - épisodes précédents : RiC-O converter, Sparnatural sur FranceArchives.

La Fondation SAPA, Archives suisses des arts de la scène, est un centre d’archives et de compétences pour la préservation et la valorisation du patrimoine culturel des arts de la scène en Suisse.

La fondation utilise un graphe de connaissances au coeur de la gestion de ses collections. Ce graphe est une lasagne à 3 "couches", plus une :

  • La couche centrale, la plus importante est la description du contenu des lots de documents conservés par la fondation. Cette partie est maintenue par des archivistes, et est modélisée en RiC-O
  • La couche "basse" (conceptuellement parlant) est la description physique des documents, y compris des medias numériques. Cette partie est maintenue par des conservatrices-restauratrices. Elle est aussi basée sur RiC-O (ce sont des Instantiations), mais étendue avec des métadonnées spécifiques pour la description de media venant notamment d'ebucore et premis.
  • La couche "haute" est la capture de la connaissance des contextes liés aux collections : personnes, compagnies, productions, théatres, représentations, oeuvres, etc. Ces entités sont inter-reliées. Cette partie est maintenue par des documentalistes, et modélisée avec FRBRoo et le CIDOC-CRM.
  • La couche supplémentaire est l'ensemble des vocabulaires contrôlés qui servent de support à la description des autres entités.

Ces 4 parties sont intimement liées dans un même graphe, ce qui assure la compatibilité et la fluidité des données entre les métiers : les objets physiques et les medias sont liées aux ressources intellectuelles des collections, qui sont elles-mêmes indexées sur les entités nommées de la partie connaissance. L'ensemble s'appuie sur la couche transversale des vocabulaires contrôlés.

Le diagramme suivant créé par Baptiste de Coulon, data archiviste de la Fondation SAPA, donne une idée de la structure du graphe de connaissances:

Le graphe est navigable dans la plateforme publique SAPA et exposé dans un service SPARQL. Les données seront également disponibles dans un dump RDF téléchargeable.

Sparna travaille avec la fondation SAPA, notamment sur:

  • la re-documentation des couches du modèle de données, sur la base de spécifications SHACL. Ces documentations sont publiées à http://shapes.performing-arts.ch/
  • la mise en place d'une interface de recherche simplifiée ("à facettes"), directement interfacée avec les données RiC-O des Instantiations. Cette interface de recherche simplifiée est dérivée de Sparnatural.
  • la gestion et la publication des vocabulaires contrôlés servant de support à la description des autres entités. Ces vocabulaires sont publiés dans un site dédié.
  • l'amélioration continue du graphe de connaissances, notamment par des contrôles qualité et des nettoyages.

On peut retrouver plus de détails dans l'intervention de Baptiste de Coulon à la conférence semweb.pro 2024.