Créer un jeu de données éditable à l'aide d'un schéma de référence
Comme leur nom l'indique, les jeux de données éditables sont des jeux de données modifiables.
Il est possible de modifier le schéma des colonnes à la main sur un jeu de données éditable.
Les contributeurs peuvent ensuite ajouter des lignes une par une à l'aide du formulaire, ou plusieurs lignes à la fois à l'aide d'un jeu de données possédant un schéma identique au jeu de données éditable.
Dans ce cours, nous vous faisons découvrir une nouvelle méthode pour créer le schéma de notre jeu de données éditable à l'aide d'un schéma de référence déjà présent sur la plateforme Koumoul.
Cette nouvelle méthode présente plusieurs avantages : la création du jeu éditable est rapide, automatisé et le jeu de données éditable possède exactement le même schéma que le schéma de référence.
Il est ainsi possible de créer plusieurs jeux de données éditables à l'aide d'un même schéma, puis de les concaténer pour obtenir un seul jeu de données regroupant tous les jeux de données éditables. Par exemple, plusieurs partenaires peuvent ainsi travailler chacun sur leur jeu de données pour ensuite regrouper l'ensemble des jeux de données.
Il est également possible de créer ses propres schémas de référence et de créer de multiples jeux éditables qui suivent ce schéma de référence privé.
Création du jeu de données
Pour créer un jeu de données éditable, cliquez sur le (+) de la page des jeux de données sur data fair.
Choissisez ensuite la vignette éditable et renseignez le titre de votre jeu de données.
À l'étape suivante, nous pouvons choisir un schéma de référence présent sur la plateforme Koumoul.
Certains schémas de schema.data.gouv.fr sont présents dans cette liste. Nous importons régulièrement des schémas gouvernementaux pour qu'ils soient disponibles sur la plateforme Koumoul.
Pour notre exemple, nous choisissons le schéma des subvetions issu de schema.data.gouv.fr.
Nous cochons la copie du schéma et la copie de la description du schéma de référence.
Si vous avez des départements dans votre organisation, choissisez le département propriétaire du jeu de données.
Votre jeu de données éditable est créé en quelques secondes et il possède un schéma identique au schéma de référence.
Dans la section des métadonnées, vous pouvez constater que la description du jeu de données provient du schéma de référence.
Dans la section des données, vous pouvez enregistrer les données une par une via formulaire ou importer plusieurs lignes à l'aide d'un fichier.
Contribuer au jeu de données
L'ajout d'une ligne est disponible à l'aide du bouton (+) dans la section des données.
Une fenêtre avec un formulaire de saisie vous permet de renseigner les valeurs pour chaque colonne.
Sur certaines colonnes, des valeurs sont prédéfinies sous forme de liste, car le schéma des données du gouvernement n'accepte que ces valeurs.
Sur des colonnes avec des données de référence, des valeurs vont être proposées.
Dans notre cas, la valeur proposée provient de la base Sirene et nous sommes donc certains que cette valeur existe.
Enregistrez la saisie réalisée.
La ligne est ajoutée au jeu de données éditable.
Il est également possible d'importer plusieurs lignes à l'aide du bouton « flèche » qui représente l'import de lignes par fichier.
Après avoir cliqué sur le bouton « flèche », choisissez le jeu de données à importer ainsi que le séparateur du jeu de données.
Une option est disponible si vous souhaitez supprimer les lignes existantes du jeu de données.
Après avoir chargé votre jeu de données, le compte rendu de l'import est disponible dans la fenêtre.
Les erreurs des colonnes et des lignes sont présentes dans le compte rendu.
Vous pouvez ainsi supprimer ou modifier les colonnes de votre fichier pour obtenir le schéma correspondant au schéma de référence.
Lorsque les erreurs sont présentes sur les valeurs, la ligne en erreur n'est pas importée.
Les numéros de lignes en erreur sont affichés pour trouver plus facilement les erreurs des valeurs.
Toutes les lignes conformes aux règles du schéma du jeu de données sont importées.
Le temps d'import dépend du nombre de lignes importées.
Si vous avez des remarques sur ce cours, n'hésitez pas à nous contacter pour nous en faire part.