Nos
formations

Formation "Web de données, graphe de connaissances : introduction pour une mise en oeuvre intelligente" - 3 jours

Objectifs de la formation

Le web de données recouvre des problématiques difficiles à démêler pour un oeil novice : structuration des contenus, modélisation d'ontologies, linked open data, réutilisation de données ouvertes, bases de graphes, graphes de connaissances, etc. Cette formation donne, en 3 jours, un panorama complet des problématiques, des principaux standards, des "gisements de données" incontournables et des types d'outils utilisables dans le contexte d'un projet exploitant ces technologies. Elle donne également les clés pour bien aborder un projet utilisant les technologies du web de données.

A l'issue de cette formation, dispensée par un spécialiste avec 12 ans d'expérience de terrain, vous aurez les réponses aux questions suivantes :

  • qu'est-ce que le web de données ? à quels problèmes répond-il ?
  • comment encoder des informations en triplets RDF ? quelles sont les différentes syntaxes RDF ? comment lire et écrire des fichiers Turtle et RDF/XML ?
  • comment structurer sémantiquement les contenus d'une page web ? quel est le lien avec schema.org ?
  • comment écrire des requêtes en langage SPARQL ? quelles sont les possibilités de ce langage ? a quoi peut-il servir ?
  • qu'est-ce qu'une ontologie ? comment réutiliser des ontologies existantes ? comment créer une ontologie RDFS et OWL en utilisant Protégé ?
  • qu'est-ce que Wikidata et DBPedia ? comment exploiter des données structurées du web pour nos propres besoins ?
  • comment déployer son propre graphe de connaissance dans un triplestore ?
  • quels sont les différents moyens de publier des données structurées sur le web ?

A qui s'adresse cette formation ?

Au croisement du web et des données, cette formation s'adresse aussi bien à spécialistes en sciences de l'information (documentalistes, bibliothécaires, veilleurs) qu'à des profils techniques (développeurs) ou des profils métier (chefs de projet, architecte de données). L'accent est mis plutôt sur le côté documentation ou plutôt sur le côté technique en fonction de l'auditoire.

Prérequis

Connaissance de HTML et XML indispensables. Notions de modélisation (UML ou autre). Notions de bases de données (SQL). Maîtrise et compréhension d'Internet (clients, serveurs, HTTP) et des moteurs de recherche.

Programme de la formation

         

Introduction au web de données

  • Notions de bases, URIs
  • Le Linked Open Data, DBPedia, Wikidata
  • Exemples d'applications

RDF : modèle de structuration des données

  • Modèle RDF - encodage des données en triplets
  • Les différentes syntaxes RDF. Décoder la syntaxe Turtle
  • Les triplestore : installation et manipulation d'un triplestore

SPARQL

  • Syntaxe et opérateurs de requêtes SPARQL 1.0 et SPARQL 1.1
  • Exercices d'écriture de requêtes sur DBPedia et/ou des données locales

RDFa et JSON-LD : du RDF dans les pages web

  • Schema.org : le modèle de structuration des données pour les moteurs de recherche
  • Syntaxe RDFa : ajouter des marqueurs pour structurer une page web
  • Syntaxe JSON-LD : ajouter une entête JSON pour exprimer du RDF

Les thesaurus SKOS

  • Les thesaurus et leur intérêt pour le web de données
  • Structurer un thesaurus en SKOS
  • Exemple de thesaurus publiés en SKOS sur le web de données

Les ontologies OWL

  • Introduction aux ontologies. Différences entre ontologie et thesaurus
  • Les opérateurs de construction d'une ontologie en RDFS et OWL
  • Exercice de modélisation d'une ontologie OWL en utilisant Protégé

 

Adapter cette formation

Cette formation, dispensée par un spécialiste avec 12 ans d'expérience, est réalisable dans vos locaux et modulable en fonction de vos problématiques : le format peut être adapté (2 jours au lieu de 3), le contenu modulé en fonction des stagiaires, ou des données spécifiques peuvent être utilisées comme support. Pour cela, contactez-nous.

Sparna est enregistrée comme organisme de formation sous le n° 24 37 03080 37 auprès du préfet de la région Centre.

 

Formation "Web de données avancé : techniques et outils pour le développement d'applications" - 2 jours

Objectifs de la formation

Cette formation fait suite à la formation d'introduction sur le web de données en 3 jours. Plus technique, elle a pour objectif de donner les capacités aux participants d'utiliser les bonnes méthodes et les outils importants pour la mise en oeuvre d'un projet web sémantique. Elle s'adresse donc à des personnes ayant des notions de programmation Java et XSLT.

Sur 2 jours, cette formation permettra aux participants de répondre aux questions suivante :

  • Comment tirer parti de requêtes SPARQL avancées ? (requêtes fédérées, requêtes de transformation de données, etc.)
  • Comment manipuler des données RDF dans des scripts, des programmes (Java), en utilisant RDF4J ou Jena, pour faire des transformations de données ?
  • Comment alimenter un graphe de connaissance avec des données relationelles, XML, CSV, JSON, etc. ?
  • Comment exposer des données RDF sur le web ?
  • Quels sont les principaux modèles d'ontologie à connaître pour réutiliser, traiter ou publier des données ?

A qui s'adresse cette formation ?

Cette formation web de données avancée s'adresse à des développeurs, des chefs de projet ou des consultants désireux de se perfectionner sur le web de données ou qui sont dans une phase de réalisation d'un projet utilisant les technologies du web de donnée.

Prérequis

Avoir des notions de développement Java. Notions de XML et XSLT. Connaitre les technologies fondamentales du web de données (RDF, SPARQL, OWL) ou avoir suivi la formation "Web de données, web sémantique : introduction pour une mise en oeuvre intelligente".

Programme de la formation

         

RDF et SPARQL avancé

  • SPARQL Update : les opérations de mise à jour SPARQL
  • SPARQL avancé : tirer parti des graphes nommés
  • SPARQL opérations non-standards : recherche full-text et recherche spatiale

GraphDB : triplestore, et l'API RDF4J

  • Déployer GraphDB et utiliser l'interface d'administration
  • Charger des données, explorer des données
  • L'API Java RDF4J : lecture/écriture de RDF, exécution de requêtes SPARQL

Apache Jena

  • Scripts en ligne de commande : SPARQL, inférence ou traitements sans écriture de code
  • L'API Java Jena : lecture/écriture de RDF, SPARQL
  • Utiliser un moteur d'inférence OWL

Conversion de données natives en RDF

  • Convertir du XML en RDF/XML en utilisant une feuille de style XSLT
  • Convertir du CSV en RDF
  • Utiliser l'outil de mapping OntoRefine de GraphDB
  • R2RML et Direct Mapping : conversion d'une base relationnelle en RDF avec OnTop

Publication de données RDF

  • Pubby : un outil pour la négociation de contenu
  • Aligner ses données avec DBPedia

Modèles d'ontologies réutilisables

En fonction des besoins des participants, on pourra voir dans le détails 1 ou 2 modèles de données dédiés à des problématiques particulières, parmi (liste non exhaustive) :

  • FRBR (notices bibliographiques)
  • CIDOC-CRM (données patrimoniales)
  • RIC-O (Records In Context, fonds d'archives)
  • ORG (organisations)
  • RDF Data Cube (données statistiques)
  • SKOS (thesaurus)
  • schema.org (Google)
  • etc.

Adapter cette formation

Par nature, cette formation web de données avancée nécessite une adaptation particulière en fonction du projet, des données. Si votre problématique nécessite l'emploi d'outils particuliers (moteurs d'inférences, bases RDF, ETL sémantiques), ou de modèles de données particuliers, le contenu de base de la formation sera adapté pour les prendre en compte. Pour cela, contactez-nous.

Sparna est enregistrée comme organisme de formation sous le n° 24 37 03080 37 auprès du préfet de la région Centre.

Autres formations web sémantique sur-mesure

Nous pouvons proposer des formations sur-mesure sur le web de données entièrement adaptées à votre problématique. Typiquement, nous avons déjà réalisé les formations suivantes :

Formation "SPARQL avancé : en long, en large et en travers" - 2 jours

Une formation de 2 jours entièrement dédiée au langage SPARQL. Pour des équipes désireuses de se perfectionner sur ce langage et en tirer le meilleur parti. Les exercices sont typiquement faits directement sur les données RDF des participants pour coller au maximum aux attentes. Les points suivants sont abordés :

  • rappel du modèle de données RDF
  • opérateurs de base SPARQL 1.0
  • utilisation des graphes nommés
  • property paths et négation
  • assignation et aggrégations (GROUP BY)
  • requêtes fédérées (SERVICE)
  • fonctions FILTER et création d'URIs à la volée
  • opérations de modifications (INSERT, DELETE)
  • requêtes CONSTRUCT pour la transformation de données
  • éventuellement, en fonction du triplestore de prédilection, opérateurs non-standards de recherche plein-texte ou de recherche spatiale
  • langage de description de service SPARQL

Contactez-nous pour adapter cette formation à votre projet.

Formation "Alignement de thesaurus SKOS" - 1 journée

Une formation d'une journée avec un objectif : être capable de créer des alignements entre thesaurus SKOS. Cette formation nécessite d'avoir au préalable un thesaurus "maison" au format SKOS à aligner (nous contacter si besoin de réaliser cette transformation). A destination des professionnels de l'information responsables de la maintenance de vocabulaires contrôlés, cette formation passe en revue les points suivants :

  • Introduction au web de données : notions de bases, URI
  • RDF : modèle de données, syntaxe Turtle
  • SKOS : détail du modèle, outils disponibles
  • Manipulation de l'outil OnaGUI pour aligner entre eux 2 thesaurus et produire un alignement SKOS

A l'issue de cette journée les participants sont capables d'utiliser l'outil OnaGUI et de conduire un projet d'alignement de thesaurus en SKOS.

Contactez-nous pour adapter cette formation à votre projet.

Formation "Ontologies et Thesaurus, SKOS et OWL : quelle articulation ?" - 2 jours

Une formation de 2 jours qui traite spécifiquement des thesaurus et de leur articulation avec les ontologies. Dédiée aux gestionnaires de ces vocabulaires qui s'interrogent sur une éventuelle évolution vers les ontologies, cette formation s'appuie typiquement sur le/les thesaurus des participants pour coller au maximum aux attentes. Cette formation aborde les points suivants :

  • Thesaurus : modèle de données SKOS dans le détail (SKOS-XL, collections, règles d'inférence)
  • Ontologie : opérateurs OWL et RDFS
  • Exercice de création d'une ontologie en utilisant Protégé
  • Caractérisation des différences entre l'approche thesaurus et l'approche ontologie
  • Structurer un thesaurus : polyhiérarchie, facettes, micro-thesaurus, gestion des termes, etc.
  • Aligner deux thesaurus et aligner deux ontologies
  • Outils de gestion et de publications de thesaurus SKOS
  • Discussion ouverte autour des données des participants

Contactez-nous pour adapter cette formation à votre projet.

Comment adapter les formations ?

Vous souhaitez mettre au point une formation adaptée pour vos équipes ? Le processus est le suivant :

  1. Nous définissons ensemble lors d'un rendez-vous téléphonique vos besoins en terme de :
    • contenu
    • durée
    • effectif formé
  2. Je rédige un plan de formation détaillée qui propose un déroulé heure par heure du contenu de la formation.
  3. En parallèle nous nous assurons que tous les stagiaires maîtrisent les prérequis nécessaires par le biais d'un questionnaire QCM.
  4. Nous ajustons si besoin ensemble le plan de formation et une fois finalisé il est intégré dans un devis final.