Créer un jeu de données éditable à l'aide d'un schéma de référence
Comme leur nom l'indique, les jeux de données éditables sont des jeux de données modifiables.
Il est possible de modifier le schéma des colonnes à la main à la main sur un jeu de données éditable.
Les contributeurs peuvent ensuite ajouter des lignes une par une à l'aide du formulaire, ou plusieurs lignes à la fois à l'aide d'un jeu de données possédant un schéma identique au jeu de données éditable.
Dans ce cours, nous vous présentons une nouvelle méthode pour créer le schéma de votre jeu de données éditable en utilisant un schéma de référence déjà disponible sur la plateforme Koumoul.
Cette nouvelle méthode présente plusieurs avantages : la création du jeu éditable est rapide et automatisée, et le jeu de données éditable possède exactement le même schéma que le schéma de référence.
Il est ainsi possible de créer plusieurs jeux de données éditables à partir d'un même schéma, puis de les fusionner pour obtenir un jeu de données unique regroupant tous les jeux de données éditables. Par exemple, plusieurs partenaires peuvent travailler chacun sur leur propre jeu de données avant de les regrouper en un seul ensemble.
Vous avez également la possibilité de créer vos propres schémas de référence et de les utiliser pour générer plusieurs jeux de données éditables.
Création du jeu de données
Pour créer un jeu de données éditable, cliquez sur le bouton (+) de la page des jeux de données sur Data Fair.
Sélectionnez ensuite la vignette Éditable et renseignez le titre de votre jeu de données.
À l'étape suivante, vous pouvez choisir un schéma de référence disponible sur la plateforme Koumoul.
Certains schémas de schema.data.gouv.fr sont inclus dans cette liste. Nous importons régulièrement des schémas gouvernementaux pour les rendre disponibles sur la plateforme Koumoul.
Pour notre exemple, nous choisissons le schéma des subvetions issu de schema.data.gouv.fr.
Nous cochons les options pour copier le schéma et la description du schéma de référence.
Si votre organisation comporte des départements, sélectionnez le département propriétaire du jeu de données.
Votre jeu de données éditable est créé en quelques secondes et possède un schéma identique à celui du schéma de référence.
Dans la section des métadonnées, vous pouvez constater que la description du jeu de données provient du schéma de référence.
Dans la section des données, vous avez la possibilité d'enregistrer les données une par une via un formulaire ou d'importer plusieurs lignes à l'aide d'un fichier.
Contribuer au jeu de données
Vous pouvez ajouter une ligne en utilisant le bouton (+) dans la section des données.
Une fenêtre avec un formulaire de saisie vous permet de renseigner les valeurs pour chaque colonne.
Pour certaines colonnes, des valeurs sont prédéfinies sous forme de liste, car le schéma des données du gouvernement n'accepte que ces valeurs. Pour les colonnes avec des données de référence, des valeurs vous seront proposées. Dans notre cas, la valeur proposée provient de la base Sirene, ce qui garantit son existence.
Enregistrez la saisie effectuée.
La ligne est alors ajoutée au jeu de données éditable.
Il est également possible d'importer plusieurs lignes en utilisant le bouton en forme de flèche, qui représente l'import de lignes par fichier.
Après avoir cliqué sur le bouton en forme de flèche, sélectionnez le jeu de données à importer ainsi que le séparateur utilisé dans le jeu de données.
Une option est disponible si vous souhaitez supprimer les lignes existantes du jeu de données.
Après avoir chargé votre fichier, le compte rendu de l'import est affiché dans la fenêtre.
Le compte rendu contient les erreurs relatives aux colonnes et aux lignes.
Vous pouvez ainsi supprimer ou modifier les colonnes de votre fichier pour obtenir le schéma correspondant au schéma de référence.
Lorsque des erreurs sont présentes sur les valeurs, la ligne concernée n'est pas importée. Les numéros des lignes en erreur sont affichés pour faciliter la recherche des erreurs de valeurs.
Toutes les lignes conformes aux règles du schéma du jeu de données sont importées.
Le temps d'importation dépend du nombre de lignes importées.
Si vous avez des remarques sur ce cours, n'hésitez pas à nous les communiquer.