VariaEssai

Data.gouv.fr : de l’ouverture des données à l’ouverture des possibles ? [Record]

  • Yannick Maignien

Le 5 décembre 2011, le Gouvernement a ouvert le portail data.gouv.fr préparé depuis 9 mois par la mission ETALAB dirigée par Séverin Naudet. Ce portail d’ouverture des données publiques réunit à son inauguration environ 330 000 jeux de données, c’est-à-dire des fichiers ou base de données administratives de l’État, des collectivités territoriales ou d’établissements publics, et même d’entreprises de l’État (SNCF…) ou EPIC (non inclus a priori dans cette obligation d’ouverture de publication). Le but avancé de cette opération est la transparence de l’accès et la réutilisation des données publiques. Transparence inaugurée en 1978 par la loi sur l’accès aux documents administratifs. La directive européenne de 2003 portant sur la réutilisation des informations du secteur public a modifié cette loi transposée dans le droit français en 2005. La mise en œuvre du portail data.gouv.fr intervient dans un contexte politique de campagne électorale propice aux bilans – y compris numériques ! – et dans une problématique d’innovation exacerbée par la crise économique et les interrogations sur la croissance. Au-delà de ces tenants et aboutissants, l’open data à la française s’inscrit dans une évolution sur Internet ouverte par les États Unis : data.gov en mars 2009 (Barak Obama) et le Royaume Uni : data.gov.uk en janvier 2010 (Gordon Brown). Par ailleurs, comme le rappelle Data Publica : Ce phénomène d’ouverture des données publiques représente une transformation profonde des conditions d’accès et de réutilisation des contenus numériques. Nous voudrions surtout souligner ici, avec l’Open public data, combien est initié en même temps qu’un régime inédit du Web, une ouverture de ses possibles techniques, éditoriaux, économiques et politiques. Les données numériques, accumulées depuis des années, en base de données, voient non seulement leur contenu « brut » mis à disposition, mais également et graduellement les relations et structures de tables de données. Celles-ci, par leur structuration syntaxique et leur contexte des domaines décrits (ensembles statistiques, comptables, démographiques, scientifiques, etc.) faisaient jusqu’à maintenant partie du « Web profond », inaccessible par les navigateurs Web, sauf par le truchement d’outils de requêtes spécifiques et dédiés au type de base de données utilisées (souvent propriétaires). Depuis une quinzaine d’années, sous l’impulsion de Tim Berners Lee, le développement d’une interopérabilité fondée sur de nouveaux standards, propose de privilégier les données, de « libérer les données », et de développer, sous l’étiquette de Web sémantique, les outils automatiques de traitement de l’information structurée à l’échelle de l’ensemble du Web. Les formats de données ont ainsi évolué radicalement, au point que le Web sémantique permet d’exprimer complètement le modèle logique relationnel minimal (triplet sujet-prédicat-objet) d’unités de sens clairement identifiées (URI). Depuis une dizaine d’année ce modèle RDF du W3C pour le Web sémantique permet d’exprimer l’indépendance et la richesse relationnelle de grands ensembles de données, et d’interconnecter ces ensembles de « triple store », afin de les faire communiquer entre eux « automatiquement », c’est-à-dire de machine à machine, à la demande des utilisateurs et de leurs requêtes complexes. Cette rupture à l’égard du Web de documents, de sites Web HTML, permet d’aller beaucoup plus loin que les liens hypertextes, qui doivent être préalablement implémentés, afin d’ouvrir aux « humains » les possibilités de navigation intertextuelles ou contextuelles. Les arborescences les plus complexes, mais cloisonnées, hétérogènes, deviennent transposables dans des graphes, déformables quantitativement et qualitativement, peuplant l’ensemble de l’Internet mondial. En parallèle, des langages d’expression des cohésions sémantiques de domaines spécifiques (scientifiques, documentaires, conventionnels…) de plus en plus clairement identifiés dans des vocabulaires types, se standardisent en ontologies. Ceci permet de capitaliser et de pérenniser la culture propre à tel ou tel domaine de référence dans les activités …

Appendices