La plateforme data.gouv.fr au service de la veille stratégique

Dans le cadre de sa politique d’ouverture des données publiques (open data), l’État français met à la disposition de tous une plateforme regroupant un ensemble de jeux de données publiques sur le site <data.gouv.fr>. Ce plateforme est en accès libre depuis sa création en 2011 et peut servir d’outil de veille pour un organisme souhaitant avoir des données sur un domaine particulier.

Avant d’expliquer l’utilisation pratique de cette plateforme comme un outil de veille, il est essentiel de dresser un état des lieux législatifs sur l’open data des organismes publics français afin de comprendre le fondement et l’opérabilité de cette ressource.

Fondement législatif de l'open data en France

Il existe trois dates majeures avant la mise en place de la plateforme pour l’ouverture des données numériques de l’État français :

  • 1978 : La loi du 17 juillet 1978 portant sur la liberté d’accès aux documents administratifs (dite loi CADA). Selon cette loi “sont considérés comme documents administratifs, au sens des chapitres Ier, III et IV du présent titre, quels que soient leur date, leur lieu de conservation, leur forme et leur support, les documents produits ou reçus, dans le cadre de leur mission de service public, par l’Etat, les collectivités territoriales ainsi que par les autres personnes de droit public ou les personnes de droit privé chargées d’une telle mission.” Cependant, celle-ci n’impose pas de publier les données au format numérique et de manière proactive. Malgré cette dispense, les citoyens possèdent un droit de regard sur ces données publiques.
  • 2005 : La directive européenne concernant la réutilisation des informations du secteur public qui précise les conditions de réutilisation des données datant du 17 novembre 2003. Cette directive est transposée dans le droit français par une ordonnance du 6 juin 2005 qui simplifie la réutilisation des données ou documents existants, détenus par des organismes du secteur public
  • 2011 : Le décret du 26 mai 2011 posant le principe de gratuité à la réutilisation des documents et données publiques et se concrétise par la mise en ligne de la plateforme « data.gouv.fr ».

Suite au lancement du site internet, deux dates accompagnées par leurs textes de loi vont favoriser la réutilisation, la gratuité et la diffusion numérique des données publiques :

  • 2015 : La loi Valter du 28 décembre 2015 qui pose le principe de réutilisation, de gratuité et la réutilisation des données publiques
  • 2016 : La loi pour une République numérique du 7 octobre 2016 qui va généraliser la gratuité et la réutilisation libre des données publiques et dans une logique de diffusion par défaut de ces dernières
Infographie de la plateforme Open-data des données publiques françaises

Attention, il y a tout de même des limites législatives quant à la publication des données sur le site, celles protégées par la loi.  La CADA précise la liste des données qui ne peuvent pas y figurer :

    1. Le secret de la défense nationale
    2. Le secret de la conduite de la politique extérieure
    3. La monnaie et le crédit public
    4. Le secret médical
    5. Le secret de la vie privée
    6. Les secrets industriels et commerciaux
    7. Le secret des procédés
    8. Le secret des informations économiques et financières
    9. Le secret des stratégies commerciales

Nature des données présentes sur "data.gouv.fr"

Comme indiqué sur le site : “Tout le monde peut publier des données sur data.gouv.fr, du moment qu’il s’agit de données d’intérêt public.”.

Plus de précisions ont été apportées sur les données qui peuvent être déposées sur le site :

  • Pas d’information personnelle ni de secret régi par la loi (cf. fondement législatif) 
  • Complément de données publiques déjà existantes réalisé par un tiers 
  • Production de données réalisée en dehors d’une mission étatique

Sachant cela, il est essentiel pour un organisme souhaitant utiliser un jeu de données issu de data.gouv.fr de faire attention à l’organisation qui a produit le jeu de données et à la méthodologie employée

Comme il est possible pour n’importe quel organisme de publier des données sur <data.gouv.fr>, des critiques ont été formulées par l’Union européenne sur certains jeux de données. Ainsi, et pour faciliter la compréhension par les utilisateurs, un badge de certification issu de cet organisme est placé à côté de l’organisme du jeu de données pour garantir les jeux de données.

Badge de certification sur data.gouv .fr
Badge certifiant l'organisme producteur du jeu de données

Utilisation pratique du site

Accès aux sets de données

Il est possible d’avoir accès à l’ensemble des jeux de données en les filtrant selon différents critères (https://www.data.gouv.fr/fr/datasets/) : 

  • Organisation productrice du jeu de données
    • Sur la barre de recherche, il y a  une liste déroulante de l’ensemble des acteurs qui ont déposé leurs données sur le site
  • Mots clés
    • A préciser selon les besoins de la recherche
  • Licences
    • L’ensemble des licences indiquant les droits et devoirs lors de la réutilisation d’un jeu de données
  • Formats des fichiers
    • Que l’on va indiquer (par exemple: JPG, XLS, PDF, etc.)
    • Qui permet de faire des recherches approfondies

Après avoir cliqué sur « « ,  plusieurs champs apparaissent :

  • du …/…/… à …/…/…
    • Permet d’avoir une période de couverture temporelle sur les données
  • Zone de couverture spatiale
    • Zone géographique
      • Que l’on va indiquer (pays, régions, départements, villes, etc.)
    • Granularité territoriale
      • Liste déroulante de filtres qui va circonscrire la recherche
      • Attention, les catégories  « point d’intérêt » et « autre » présentes dans la liste et qui ne font pas réellement partie de la logique de couverture spatiale
Criteres de recherche sur data.gouv .fr

Après avoir sélectionné un jeu de données, celui-ci est accompagné de plusieurs métadonnées sur la production et la réutilisation de ces données, notamment:

  • L’intitulé du jeu de données
  • La licence  qui le régit
  • Le producteur
    • Avec une certification ou non
  • Les métadonnées (voici la liste indiquée sur la plateforme, dans les faits, l’intitulé du set de données est considéré comme une métadonnée mais ce n’est pas le cas sur <data.gouv.fr>)
  • Des actions
    • L’ajout d’une réutilisation de la base de données
    • La possibilité de contacter le producteur
    • Un lien URL stable du jeu de données
  • Le sommaire
    • Description du jeu de données
    • Les ressources brutes
    • Les ressources communautaires qui complètent le jeu de données initial
    • Les réutilisations par des tiers
    • Une partie discussions

Pour les personnes ne sachant pas utiliser les données brutes, des contributeurs mettent à disposition des réutilisations des jeux de données sélectionnées. Souvent graphiques, elles permettent de synthétiser ou cartographier ces données.

Il n’existe pas nécessairement des réutilisations des bases de données.

Information producteur de donnees
Ensemble des informations sur un jeu de données issu de data.gouv.fr

Utilisation concrète dans un processus de veille des bases de données de "data.gouv.fr"

Mise en situation :

Monsieur X est un chef d’entreprise qui vend des équipements sportifs d’extérieur et souhaite avoir des informations sur la répartition géographique des équipements disponibles en France afin de prospecter des villes ou villages n’ayant pas d’équipements.

Pour répondre à cette demande, Monsieur X va noter “sport” dans la barre des mots clés.

Exemple 1 utilisation data.gouv .fr

Dans cette situation, il a de la chance, car il existe un set de données qui recense les équipements sportifs, espaces et sites de pratique.

Exemple 2 utilisation data.gouv .fr

Après avoir cliqué sur la base de données qui m’intéresse, j’obtiens diverses informations sur le producteur de données (ici le ministère des Sports), une description de ce dernier et un accès aux diverses ressources relatives à la base de données.

Etape 3 utilisation data.gouv .fr

Dans cette situation, le visiteur souhaite simplement savoir quels sont les équipements sportifs dans toute la France. Par conséquent, il regarde dans les ressources pour vérifier la présence d’un dossier comptant le recensement des installations sur l’ensemble du territoire.

Sa recherche sur data.gouv.fr
Terminée 100%

Dans la mesure où Monsieur X n’est pas un expert dans l’utilisation des données brutes, il vérifie dans la section réutilisation s’il n’existe pas une valorisation de ces dernières.

Dans ce cas de figure, il existe diverses cartes permettant d’avoir accès à l’ensemble des équipements sportifs au niveau national.

Etape 4 utilisation data.gouv .fr

Attention : Cet exemple est fictif et sert une démarche d’utilisation pratique du site. Il est nécessaire de faire des recherches approfondies sur certaines bases de données incomplètes ou inexistantes sur data.gouv.fr. 

Compléments d'information

Il existe une plateforme numérique européenne des différents sets de données sur data.europa.eu. Le site effectue la même mission que la plateforme française, mais au niveau des pays membres de l’Union européenne.

« Data.europa.eu » produit annuellement un rapport comparant l’évolution de l’ouverture des bases de données à l’échelle européenne et indique que la France est plutôt bonne élève dans sa politique nationale d’ouverture des données de santé.

M1 Intelligence Économique - Promotion 2021/2022