Règles sur les données
Data Fair offre la possibilité de configurer des règles de saisie pour restreindre les valeurs des colonnes dans vos ensembles de données.
Dans ce cours, nous allons d'abord voir comment restreindre les valeurs d'une colonne numérique pour que les utilisateurs ne puissent saisir que des nombres entiers entre 1 et 99 999.
Dans un second temps, nous nous utiliserons une expression régulière pour les codes postaux, disponible dans les schémas gouvernementaux, tels que celui des jeux de données des Défibrillateurs Automatisés Externes (DAE) :
Restreignez les valeurs d'une colonne à un intervalle compris entre 1 et 99 999.
Pour commencer, créons un jeu de données éditable avec une colonne de type nombre.
Sur la page des jeux de données de votre compte, cliquez sur Créer un jeu de données.
Sélectionnez le type Éditable.
Donnez un Titre à votre jeu de données et cliquez plusieurs fois sur continuer pour finaliser sa création.
Dans le schéma de votre jeu de données, cliquez sur le bouton (+) pour ajouter une nouvelle colonne.
Indiquez la Clé de votre colonne [2] (ici, nous avons opté pour le nom de clé num) et le type de la colonne [3] (dans ce cas, Nombre entier, car nous souhaitons uniquement des entiers en valeur dans cette colonne).
Cliquez sur Valider.
Ajoutons maintenant une règle pour définir l'intervalle des nombres entiers.
Sélectionnez la colonne que vous venez d'ajouter [4]. Ensuite, cliquez sur le bouton des règles de la colonne [5].
Indiquez les valeurs minimale et maximale [6].
Enfin, cliquez sur le bouton Appliquer [7] pour valider l'ajout de votre colonne avec ses règles.
Pour vous assurer que votre règle est correctement appliquée à votre colonne, vous pouvez procéder à un test en ajoutant une nouvelle ligne de données.
Dans la section Données de la page d'édition du jeu de données, cliquez sur le bouton (+) pour ajouter une ligne. Saisissez une valeur supérieure à 99 999 dans le champ => Un message d'erreur s'affichera sous la section.
Le bouton Enregistrer ne sera disponible que pour une valeur comprise entre 1 et 99 999.
Ajoutez une expression régulière
Le processus pour ajouter une expression régulière à une colonne est très similaire à celui réalisé dans la première partie de ce cours.
Dans cette seconde partie, nous allons :
- Ajouter une colonne de type texte à notre jeu de données éditable,
- Trouver l'expression régulière sur un schéma de schema.data.gouv.fr,
- Ajouter l'expression régulière à notre colonne textuelle.
1. Ajoutez votre colonne de type texte
Sur l'image, nous avons ajouté la colonne code en utilisant le bouton (+) de la section du Schéma.
Il s'agit d'une colonne de type texte.
2. Trouvez l'expression régulière
Ensuite, nous recherchons l'expression régulière d'un code postal sur le site schema.data.gouv.fr.
Dans la section de recherche du site schema.data.gouv.fr, entrez DAE, puis cliquez sur la fiche correspondante.
Ensuite, cliquez sur l'onglet Documentation et recherchez le champ correspondant à un code postal sur la page.
Enfin, copiez l'expression régulière suivante :^\d{5}$.
3. Ajoutez l'expression régulière
Ajoutons maintenant l'expression régulière aux règles de notre colonne.
Sur la page de votre jeu de données sur Data Fair, cliquez sur votre colonne [1], puis sur le bouton des règles de la colonne [2], entrez l'expression régulière [3], et enfin, appliquez les changements [4].
Une nouvelle colonne est maintenant disponible dans vos données. Si vous ajoutez une valeur qui ne correspond pas à cinq chiffres, un message d'erreur s'affichera lors de la saisie.
Si vous ajoutez la valeur 56000, qui correspond au code postal de la ville de Vannes, et que vous Enregistrez votre ligne, celle-ci apparaîtra alors dans la section des Données de votre jeu de données.
Dans ce cours, nous avons utilisé des jeux de données éditables pour restreindre les valeurs des données.
Il est également possible de renseigner des règles par colonne sur des jeux de données créés à l'aide de fichiers. Le jeu de données sera réindexé au moment de valider la règle et les lignes qui ne la respectent pas seront indiquées dans le message d'erreur.
Par exemple, sur un fichier avec une colonne parcelle, nous avons coché la case information obligatoire sur cette colonne parcelle.
Après réindexation du jeu de données, le journal nous informe que 98 lignes de notre jeu de données n'ont pas de valeur renseignée pour la colonne parcelle :
Dans ce cours, nous avons utilisé des jeux de données éditables pour limiter les valeurs des données.
Il est également possible de définir des règles par colonne sur des jeux de données créés à partir de fichiers.
Le jeu de données sera réindexé lors de la validation de la règle, et les lignes qui ne la respectent pas seront signalées dans le message d'erreur.
Par exemple, sur un fichier avec une colonne Parcelle, nous avons coché la case information obligatoire pour cette colonne.
Après réindexation du jeu de données, le journal nous informe que 98 lignes de notre jeu de données n'ont pas de valeur renseignée pour la colonne Parcelle.
Le jeu de données reste consultable et les données restent téléchargeables même en cas d'erreur de règle.
Exemples de regex
- Code postal : Type de la colonne => texte ; expression régulière possible =>
^\d{5}$
. - Code INSEE Commune : Type de la colonne => texte ; expression régulière possible =>
^(2[AB]\d{3}|\d{5})$
- Code SIRENE : Type de la colonne => texte ; expression régulière possible =>
^\d{9}$
. - Code SIRET : Type de la colonne => texte ; expression régulière possible =>
^\d{14}$
. - URL : Type de la colonne => texte ; expression régulière possible =>
^https?:\/\/(www\.)?[-a-zA-Z0-9@:%._\+~#=]{2,256}\.[a-z]{2,6}\b([-a-zA-Z0-9@:%_\+.~#?&//=]*)
- Téléphone à 10 chiffres avec des espaces : Type de la colonne => texte ; expression régulière possible =>
^(\d{2} \d{2} \d{2} \d{2} \d{2})?$
- Email : Type de la colonne => texte ; expression régulière possible =>
(^$|^.*@.*\..*$)
Si vous avez des remarques sur ce cours, n'hésitez pas à nous les communiquer.