La réutilisation et les réutilisateurs des données ouvertes en France: une
approche centrée sur les usagers
Par Valentyna DYMYTROVA, Post-doctorante en Sciences de
l’Information et de la Communication, EA 4147 ELICO, Université Lyon 1 et Françoise PAQUIENSÉGUY, Professeur en Sciences de l’Information et de la
Communication, EA 4147 ELICA, Sciences Po Lyon.
Bien qu’elle soit un des
éléments clefs des discours d’accompagnement de l’ouverture des données, la
notion de réutilisation reste mal définie aussi bien par les acteurs publics
que par les entreprises du numérique ou les chercheurs, chacun investissant
cette notion d’objectifs et d’attentes différents. Ces discours sur les données
ouvertes ou sur l’ouverture des données font de la réutilisation à la fois un
outil témoignant d’une plus grande transparence de l’administration et de sa
modernisation, et un facteur de développement des villes intelligentes,
assurant une croissance économique et une innovation technologique sensées
profiter aux citoyens[1]. Toutefois, malgré un
nombre important de jeux de données publiques rendues disponibles ces dernières
années via des portails
métropolitains, le nombre d’applications reste assez limité[2], tout autant que celui
d’utilisateurs, car « le nombre de services qui parviennent à la viabilité
et la pérennité l’est encore plus »[3]. D’ailleurs, il existe peu
d’études empiriques sur la réutilisation des données ouvertes sur les portails
dédiés[4] et l’intérêt porte plus
souvent sur les standards techniques de l’interopérabilité que sur les horizons
d’attentes des réutilisateurs.
À la différence de ces
modèles dominants d’analyse, centralisés et « top-down », notre
recherche est guidée par une approche centrée sur l’usager[5], ses difficultés, besoins
et attentes liés à la réutilisation des données ouvertes. Autrement dit :
qu’en est-il des réutilisateurs, usagers intermédiaires des données
ouvertes ?
En mobilisant les résultats d’une enquête de terrain menée dans le cadre de
l’ANR-14-CE24-0029[6],
cet article vise à identifier les profils des réutilisateurs, leurs stratégies
et pratiques afin de mieux cerner les leviers et les difficultés de la
réutilisation des données ouvertes, car ces enjeux sont construits a posteriori, une fois l’ouverture
effective. Celle-ci sera ici comprise comme une stratégie d’offre, de mise à
disposition par les collectivités territoriales et tout particulièrement les
métropoles françaises instituées au 1er janvier 2015, via leurs portails open data dont les
usages n’ont été ni conçus ou anticipés, mais dictés par l’injonction publique[7].
Pour cerner la question, nous préciserons d’abord les significations des termes
« réutilisation » et « réutilisateurs » dans les textes
législatifs et les documents administratifs et au sein des portails métropolitains
open data (PMOD). Ensuite, nous analyserons les représentations et stratégies
associées à la réutilisation des données ouvertes dans les pratiques
professionnelles des réutilisateurs interviewés dans le cadre de notre enquête
(n=22). Enfin, nous dégagerons les décalages et les tensions entre les
différents discours et les pratiques professionnelles analysées.
Surtout caractéristique
d’un contexte technique, le terme « réutilisation » figure dans la
plupart des définitions d’ouverture des données, à l’instar de celle proposée
par la fondation Open Knowledge International :
« une donnée ouverte est une
donnée qui peut être librement utilisée, réutilisée et redistribuée par
quiconque — sujette seulement, au plus, à une exigence d’attribution et de
partage à l’identique »[8].
La réutilisation est du registre de l’idéologie et doit être reliée à deux des
trois grandes utopies contemporaines du web[9] :
l’ouverture et la participation. Ces idéaux laisseraient penser que le lien se
crée de façon automatique ou spontanée entre offre et usages, entre données
ouvertes et réutilisations, alors que, nous le savons, mais nous le verrons
aussi, ces processus doivent se construire et les pratiques professionnelles
coloniser ces nouveaux espaces que sont les PMOD (portails métropolitains open
data). Ces deux maîtres mots d’ouverture et de participation se trouvent pris
dans un contexte contraignant à plus d’un titre. Ainsi les cadres, au sens de
Flichy[10],
technique, juridique et d’usage sont-ils aujourd’hui terriblement restrictifs,
ils peinent à converger pour construire ensemble le cadre de référence qui
témoignerait de la mise en œuvre d’un véritable écosystème de la réutilisation.
On remarque d’ailleurs très vite dans les propos des professionnels
interrogés que la réutilisation constitue l’une des caractéristiques idéales
des données ouvertes au même titre que l’accessibilité ou l’absence de
restrictions techniques[11].
Ne serait-elle qu’un
horizon d’attente ? Utopique ? Bien sûr, les données ouvertes sont
censées être réutilisables techniquement (disponibilité dans un format pratique
et modifiable), juridiquement (sous une licence autorisant leur réutilisation
et redistribution incluant le croisement avec d’autres ensembles de données),
économiquement (possibilité de redevances) et socialement (tout le monde doit
être en mesure de réutiliser et redistribuer les données ouvertes), mais la
réalité est-elle conforme à l’injonction de réutilisation, autrement dit
d’appropriation, d’acculturation de la donnée et de ses jeux ?
Le projet public
d’ouverture des données institue leur réutilisation qui représente l’objectif
et la raison d’être de la mise à disposition, comme le souligne la Charte du G8
pour l’Ouverture des Données Publiques,[12] qui voit dans la
réutilisation, la possibilité d’« acquérir des connaissances, générer des
idées et produire des services afin de créer un monde meilleur pour
tous ». De même, bien des discours d’accompagnement de l’ouverture de
données insistent sur la « réutilisation la plus large possible » et
« par le plus grand nombre »[13]. Ainsi, le Vade-mecum sur
l’ouverture et le partage de données publiques élaboré par Etalab
en 2013 précise que « la réutilisation des données publiques peut
susciter le développement de nouveaux services comme les applications mobiles,
des sites Internet, des visualisations données ou “datavisualisation” notamment
par la presse, etc. »
Finalement,
l’Administration se met en ordre de marche pour rendre certains jeux de données
disponibles (et il y aurait fort à dire sur la désignation de ces derniers) et
le reste suivra… Cependant, si les usages sont peu anticipés et de façon
extrêmement confuse comme on vient de le dire, les usagers sont définis au
regard de la collectivité territoriale et de ses interlocuteurs traditionnels.
« Les données publiques peuvent être aussi réutilisées par les chercheurs,
les enseignants, les étudiants, les responsables associatifs, les citoyens,
pour construire de nouveaux points de
vue sur la société ou sur l’action publique »[14]. Cependant, plusieurs
documents officiels[15] opèrent une distinction
entre, d’une part, développeurs et sociétés concevant des applications et, de
l’autre, citoyens et urbains, représentés comme de simples
usagers-consommateurs de ces dernières[16]. Le premier trait de
l’intermédiation assurée par les réutilisateurs apparaît ici avec les
data-journalistes et les producteurs d’applications. D’ailleurs, certains PMOD
proposent aujourd’hui dès leur page d’accueil un accès spécifique aux
« geeks », « développeur » ou autre
« réutilisateurs », il témoigne de leur accompagnement vers une
réutilisation.
D’autres, la prolongent
encore et proposent d’héberger les applications développées à partir de leurs
propres données ouvertes, c’est le cas de PMOD de Séoul, de Montréal et
d’Amsterdam. Cette réutilisation des données ouvertes par le secteur privé se
perçoit comme génératrice d’innovation et de valeur économique et sociale,
comme le souligne la Charte du G8 pour l’Ouverture des Données Publiques :
« Des données publiques librement accessibles et gratuitement
réutilisables peuvent être à la source de services et des produits innovants
susceptibles d’aider les individus à faire face plus facilement à la vie
moderne. Utilisées de la sorte, ces données amènent le secteur privé à innover,
contribuant à la création de nouveaux marchés, de nouvelles entreprises et de
nouveaux emplois »[17].
Autrement dit, la mise en œuvre de la réutilisation n’est pas souvent soutenue
par l’action publique d’ouverture, dans un premier temps du moins. La tâche est
ardue et la réforme territoriale la complique par sa redistribution des
compétences d’une part et son lot de réorganisations[18], de l’autre. Comme en
phase d’innovation, tout reste à la fois à inventer et à produire en termes de
standards techniques certes, mais surtout de compétences, de gouvernance, de métiers
et surtout d’écosystème informationnel. Et c’est bien là la dernière visée
utopique portée par l’ouverture des données : générer une smart-city, le
double numérique et computationnel d’un espace physique, qu’il faut apprendre à
habiter[19]. Poser un cadre juridique
peut être un des premiers éléments pour l’entreprendre.
En jurisprudence, la
réutilisation renvoie à l’utilisation « à d’autres fins que celles de la
mission de service public en vue de laquelle les documents ont été élaborés ou
sont détenus »[20]. Le terme
« réutilisation » s’est imposé dans l’écosystème français avec la
directive européenne dite « ISP », sur la réutilisation des
informations détenues par le secteur public[21]. Elle définit, entre
autres, les domaines dans lesquels la réutilisation des informations publiques
est autorisée et ses conditions, notamment, l’obligation de transparence sur le
calcul des redevances. La présence d’une redevance doit se justifier par des
coûts liés à la recherche et au traitement des données engagées par
l’administration.
Une autre directive
européenne, dite « INSPIRE »[22] a donné à son tour une
forte impulsion à l’ouverture des données environnementales géographiques et à
l’harmonisation des systèmes d’information géographiques au niveau européen en
les rendant obligatoires et en en définissant les conditions de mise en œuvre[23].
En parallèle, la mise à
disposition des données publiques et leur réutilisation ont été fortement
encadrées par plusieurs dispositifs législatifs nationaux récents (loi Macron,
2015, loi NOTRe, 2015, loi Valter,
2015 et loi Lemaire, 2016). Ceux-ci témoignent d’une formalisation du cadre
juridique qui laisse derrière lui une logique de la demande, en référence au
droit démocratique de l’accès aux documents administratifs[24] au profit d’une logique
d’offre que nous avons déjà soulignée et qui n’est en rien dans les traditions
et usages administratifs. Elle se fonde sur le droit économique et social de
réutilisation des données publiques posée par la directive ISP, transposée en
droit français par l’ordonnance du 6 juin 2005[25] et le décret du 30
décembre 2005[26].
Ici, la notion de réutilisation renvoie à l’exploitation des données publiques
par des tiers à d’autres fins que celles pour lesquelles elles ont été
produites ou reçues, y compris à des fins commerciales, avec une obligation de
non-dénaturation et de référencement des informations. En continuité, le décret
n° 2011-577 du 26 mai 2011 et la circulaire du Premier ministre, F.
Fillon, ont fixé le principe d’une réutilisation libre, facile et gratuite des
informations publiques pour tous les citoyens. Ces prises nettes de position,
en vue de la construction progressive d’un cadre de référence sous la forme
d’un écosystème de l’Open Data, ont pris forme dans la plateforme nationale
d’hébergement et de partage de données publiques, ouvertes et réutilisables,
produites par l’État et les collectivités : data.gouv.fr. Plus récemment,
la loi n° 2016‐1321 du 7 octobre 2016, dite loi Lemaire affirme le principe de l’ouverture
des données publiques par défaut. Elle oblige toutes les administrations à
communiquer leurs documents au format électronique, à les mettre à disposition
du citoyen dans un standard ouvert, aisément réutilisable et exploitable par un
traitement automatisé.
Ainsi, le cadre
législatif français promeut-il une réutilisation des informations publiques[27], définies en fonction de
plusieurs grands principes tels que la liberté et la gratuité des données,
laquelle réutilisation s’étend à toutes les données du secteur public ne
faisant pas l’objet d’une dérogation et aux données produites par des acteurs
privés chargés d’une mission de délégation du service public à caractère
industriel ou commercial. Plusieurs entreprises de ce type commencent
d’ailleurs à ouvrir certains jeux de données, par exemple la SNCF, la RATP,
Véolia, Decaux ou Transdev. Cette promotion se matérialise particulièrement via le lieu de la réutilisation :
le portail métropolitain open data qui donne accès aux jeux de données et,
parfois, héberge les applications qui en sont issues.
Bien que nous ayons à ce
jour analysé 24 PMOD français, européens ou internationaux dans le cadre
de l’ANR Open sensing city[28], le focus premier sera
fait ici sur celui de la Métropole de Lyon. En effet, les choix stratégiques
qui ont présidé à la genèse et au déploiement de ce portail ont immédiatement
fait une place particulière aux réutilisateurs, intégrés dès le back office
d’une part et dans la gouvernance de l’autre puisqu’en avril 2015, afin de
garantir une bonne gouvernance du PMOD et de faire converger politique et
technique, un poste de Chief Data Officer a été créé par la Métropole avec comme mission
centrale de développer et d’animer le réseau des réutilisateurs, en
articulation étroite d’une part avec le réseau professionnel des géomaticiens
du territoire et de l’autre avec le LivingLab
métropolitain, Le Tùba[29].
Ouvert le 26 mai 2013, le portail des données ouvertes de la communauté urbaine
de Lyon, Smart Data Lyon est devenu Data Grand Lyon dans le contexte de la
réforme territoriale amenant à la création de la Métropole de Lyon le 1er
janvier 2015[30].
Le PMOD lyonnais est basé sur une plateforme indépendante, développée par les
informaticiens de la Métropole elle-même[31].
Elle assure une industrialisation des process d’accès aux données provenant de
différents producteurs qui repose sur un modèle économique particulier du
courtage informationnel. Mais l’élément à retenir ici est sans doute moins le
modèle lui-même que la tentative d’en développer un et de le faire fonctionner
afin de stabiliser l’ouverture et la réutilisation dont les coûts de
développement, de déploiement et de fonctionnement, supportés par les
Métropoles, sont loin d’être négligeables et temporaires. Autrement dit, tenter
une structuration en termes de gouvernance et de modèle économique[32] témoigne d’une volonté
(même inachevée et maladroite) de penser un cadre d’usages stable.
La tâche n’est pas simple
malgré les dispositifs législatifs autour de la donnée qui tentent de lever les
freins juridiques à la réutilisation et l’innovation des services urbains
(obligation de diffusion des données, licences ouvertes, principe de gratuité).
Les politiques publiques de la donnée menées par la mission gouvernementale Etalab suivent elles-mêmes les préconisations de l’Union
européenne visant à standardiser les politiques en matière d’open data des pays
membres et contribuent à une normalisation et une harmonisation des pratiques.
Ce cadre juridique que nous avons déjà évoqué s’avère très prégnant sur
l’action locale. « Le développement territorial, qui repose beaucoup
aujourd’hui sur des processus de gestion de l’information publique, opère ici
une redéfinition de l’acteur public en fournisseur de données normalisées à des
tiers »[33].
Les plateformes et les portails métropolitains de l’open data fonctionnent
alors comme un acteur central à la fois « capacitant »[34] ses utilisateurs et en
délimitant les compétences. Ainsi tendue vers des nécessités internes, quasi de
services, liées à l’injonction d’ouverture celle de la réutilisation ne peut
être pensée première ou centrale. Les collectivités territoriales abordent la
réutilisation « à partir de leur propre héritage institutionnel et à
partir de leur posture “top down” »[35] et se préoccupent
davantage de la conformité des démarches de l’ouverture des données aux cadres
législatifs français et européen que des besoins et attentes des
réutilisateurs. Et effectivement, les portails métropolitains de l’open data en
France restent pour les réutilisateurs professionnels des « magasins de
pièces détachées » (Entretien avec un développeur). De plus, la réutilisation
est complexe et réclame des compétences spécifiques et du temps, car les
données doivent être travaillées, croisées, nettoyées, extraites, traitées...
« Un réutilisateur idéal, c’est quelqu’un qui a du temps, qui ne va pas
faire un produit commercial dans l’année, mais qui a deux-trois années devant
lui pour faire quelque chose » (Entretien avec un développeur). Beaucoup
de réutilisations (prototypes et applications) restent d’ailleurs invisibles,
car ils disparaissent avant même d’être identifiés faute de modèle économique
viable.
Rendre les données disponibles ne suffit pas pour générer la réutilisation et
ce n’est sans doute même pas la première étape, car c’est un processus complexe
qui concerne plusieurs communautés professionnelles ayant différentes finalités
stratégiques, économiques et éthiques. Cependant, une chaîne commune de
réutilisation commune se construit autour de quatre étapes clés chez les
réutilisateurs : la recherche de la donnée, son interprétation, sa
transformation et son intégration. En effet, tous les réutilisateurs sont
concernés par la recherche, localisation et téléchargement des jeux de données.
Une fois la donnée trouvée et téléchargée, elle est cependant rarement
utilisable en tant que telle. Il s’agit de la travailler afin de s’assurer de
sa qualité, fiabilité et exploitabilité (fréquence de mise à jour, structure
des données, exhaustivité). Dans tous les cas, la donnée doit être (re) — contextualisée,
car extraite de sa source, elle en perd en partie son sens. En fonction des
objectifs, des algorithmes utilisés et des savoir-faire internes, la donnée
subit ensuite différents transformations et traitements. Il peut s’agir de
nettoyer et de formater les données initiales dans des formats spécifiques, de
consolider, redresser, agréger et enrichir les données en rajoutant par exemple
des métadonnées ou en croisant les données issues de différentes sources.
Certains professionnels intègrent les données de façon automatique, d’autres
manuellement en les déposant dans un intranet ou un catalogue de données.
Pour que les données soient (ré) utilisées et pour que les réutilisateurs
puissent les manipuler et transformer en informations ou services utiles, il
faut que leurs descriptions, leurs formats et leurs métadonnées soient
compatibles avec les besoins et les savoir-faire des réutilisateurs qui n’ont
que très peu de dénominateurs communs. En effet, les écosystèmes spécifiques et
structurés conditionnent les caractéristiques des données ouvertes utilisées
qui doivent pouvoir s’intégrer dans les API, Intranet ou plateformes déjà en
présence. Agir sur ces couches techniques de format et de standardisation est
une gageure encore trop lourde pour être emportée dans les mois à venir, alors
que poser les règles de jeu de l’ouverture semble un challenge plus abordable
et tout autant nécessaire.
De façon atypique à l’échelle nationale, les jeux
de données du portail métropolitain lyonnais sont publiés sous trois types de
licence, chacune adaptée à une certaine catégorie de
données. Tout d’abord, la majorité des données sont publiées sous une Licence Ouverte, créée par la mission Etalab en 2011 et compatible avec les licences Open Government Licence du Royaume-Uni, Open Data Commons
Attribution de l’Open Knowledge Foundation
et Creative Communs Attribution 2.0 de Creative Commons3.
Cette licence ne pose aucune condition de
réutilisation. Ensuite, le Grand Lyon propose une licence engagée. Gratuite,
elle impose une déclaration préalable. Enfin, la licence associée introduit la
possibilité d’une redevance modulable en fonction du succès commercial du
produit ou du service créé. Véritable moteur complémentaire du développement
économique auquel le PMOD s’associe, la licence associée veut « garantir un écosystème
concurrentiel équitable, en évitant la formation de monopoles. Pour cela, cette
licence outre l’authentification du réutilisateur, introduit la possibilité
d’une redevance en fonction d’un seuil élevé du taux de pénétration du produit
ou du service créé. En cas de position tendant à devenir monopolistique la
redevance est élevée. Cette licence n’intègre aucun frais fixes afin d’éviter
toute barrière à l’entrée pénalisante pour les petits acteurs. Elle vise à
protéger les PME innovantes et acteurs de tailles modestes et favoriser leur
développement. »[36]
Ces deux dernières licences visent clairement à
promouvoir la réutilisation commerciale des données, mais la déclaration
obligatoire qu’elles réclament permet également à la Métropole de mieux
connaître ses réutilisateurs, de répondre à leurs besoins et de mettre en place
une communauté de réutilisateurs. Ainsi, affine-t-elle et ajuste-t-elle son
offre, car elle cible mieux ses interlocuteurs, et évolue progressivement. À la
création du PMOD lyonnais, les développeurs étaient la cible privilégiée avec
un objectif manifeste de contribution au développement économique du
territoire, à la croissance et la création de l’emploi dans une logique d’offre
et de mise à disposition que nous avons déjà évoquées. Depuis 2015, l’idée de
permettre aux citoyens de se réapproprier leurs propres données territoriales,
de proximité, via le portail « a fait son chemin » (Entretien avec un
gestionnaire de PMOD).
D’ailleurs, à ce jour, le mot de bienvenue du
portail s’adresse à un large public : « Pour accélérer l’innovation
et encourager la participation citoyenne, la Métropole de Lyon ouvre les
données de référence de son territoire…. À vous de les découvrir et de les
exploiter ! » Cependant, une analyse plus complète que nous avons
déjà présentée (Dymytrova, Hare, 2016) distingue
clairement deux voies et cibles. D’une part, celle de l’innovation, de la
création de services, porteuses de valeur ajoutée et de développement
économique du territoire, pensée aux mains des professionnels de la data, du
territoire, des acteurs économiques locaux ; de l’autre, celle de la
citoyenneté et du partage collaboratif, porteuse de convivialité, de liens
sociaux, proche d’une urbanité numérique qui rendrait la ville plus ou mieux
habitable[37]. Ce choix de positionnement se matérialise dans
la rubrique « Utiliser la plateforme Data du Grand Lyon » qui
comporte pour la réutilisation, deux entrées distinguant le « Coin de
développeurs » et le « Coin des débutants », avec tous les
sous-entendus qu’elles véhiculent.
Outil central de la panoplie Open Data développée
par la Métropole de Lyon, ce portail est le guichet unique d’accès aux données
d’un territoire, car il centralise les données locales de la façon la plus
complète possible en cherchant à y agréger toutes les données métropolitaines,
même celles qui ne sont pas soumises à l’injonction publique. Mais il prolonge
les choix politiques locaux en cherchant à assurer un lieu d’intermédiation
entre les producteurs de données, les collectivités territoriales et les
réutilisateurs de données[38], qu’ils soient de simples citoyens ou pas. La
position tenue par le PMOD de Lyon est donc d’assurer la fonction centrale de
l’entremise qui correspond bien avec la mission de la Métropole. Cependant, les
moyens qu’elle se donne pour la tenir : faire du courtage informationnel
entre les parties productrices et réutilisatrices des
données semble aller à l’encontre de celle-ci. Double mouvement paradoxal qui
fragilise particulièrement l’acteur central, la Métropole[39].
Le cadre socio-technique, tel que conçu et présenté par Flichy[40] surgit des « différentes histoires
parallèles qui ne sont pas liées entre elles. C’est l’histoire antérieure
à la constitution du cadre socio-technique qui
reprend les histoires parallèles des mondes sociaux concernés ». Dans le
contexte des PMOD, chaque réutilisateur est effectivement porteur d’une
histoire parallèle, liée à son propre écosystème et à ses propres finalités et
le cadre socio-technique ne peut se construire que
dans l’action commune que le portail matérialise et symbolise. Ainsi tenter de
cerner le réutilisateur et en comprendre l’histoire parallèle en termes de
besoins et d’horizons d’attentes[41] constitue un premier pas vers la constitution du
cadre socio-technique de la réutilisation des
données.
La plupart des documents
de communication des collectivités font référence à trois types d’acteurs de
l’Open data : les producteurs, les intermédiaires et les utilisateurs
finaux comme le soulignait déjà Chignard dès 2012[42]. Sans invalider cette typologie notre enquête a
révélé une variété de profils des réutilisateurs des données ouvertes qui pose
problème, car elle regroupe sous un intitulé théoriquement fédérateur, des
métiers, des compétences et des positions hiérarchiques différents. Notre panel
de réutilisateurs se compose en effet de producteurs de données, de
gestionnaires de projets Open Data, de coordinateurs des projets basés sur
l’utilisation des données ouvertes, de data-analystes ou journalistes, de
développeurs et de promoteurs de données ouvertes. Sur le terrain, la catégorie
structurante d’« usager intermédiaire » n’a pas de réalité claire ou
circonscrite, car un acteur peut se situer à l’interface de plusieurs
positionnements, par exemple, les développeurs ou les bureaux d’étude qui
réutilisent les données ouvertes pour générer leurs propres données et les
réexporter par la suite auprès collectivités ou, dans d’autres cas, pour les
vendre à leurs clients dans des applications clef en main. Selon leurs métiers
et fonctions, les réutilisateurs interviewés utilisent les jeux de données pour
réaliser des bases de données, des applications mobiles et web, pour faire de
la visualisation ou rédiger des rapports ou conduire des analyses.
Autrement dit, chaque acteur conserve ses spécificités et ses particularités
dans sa manière d’utiliser la donnée, ce qui oblige ces professionnels à tenir
une double injonction impossible : ils ont besoin de données le plus
brutes possible pour les intégrer ou les traiter plus facilement alors que sans
son contexte, une donnée reste inutilisable. Mais malgré la diversité des
profils de réutilisateurs interviewés, leurs besoins et les difficultés qu’ils
rencontrent dans leur utilisation des données ouvertes ont de points de
convergence.
Fortement ancrées dans un
territoire ou liées à un producteur, les données ouvertes sont éclatées entre
différents portails et plateformes. Les données diffusées par chaque collectivité
sont publiées sur un portail et une plateforme spécifique. Les mutualisations
des publications se font en fonction des découpages administratifs, par
exemple, à l’échelle d’une métropole ou d’une région. Certaines communes
diffusent leurs données à la fois leur propre portail et celui de data.gouv.fr.
Seules les petites collectivités territoriales publient leurs données
uniquement sur le portail national. Mais les données ouvertes sont également
hébergées sur des portails spécialisés d’administrations ou institutions comme
l’Insee ou encore sur ceux des entreprises privées publiant leurs données comme
data.sncf.com. D’une manière générale si la continuité et la prédictibilité de
l’évolution de la donnée dans le temps sont très importantes pour tous les réutilisateurs
leurs difficultés sont moins techniques qu’organisationnelles ou
décisionnelles, à cause du caractère politique et stratégique de l’ouverture
des données pour les acteurs territoriaux. En effet, dans ce contexte très peu
structuré et assez hétéroclite, plusieurs interviewés aspirent à la mise en
place d’un outil commun des données ouvertes au niveau national, voire
européen : « Une plateforme
par ville ou par transporteur c’est un peu extrême » (Entretien avec un
développeur). De plus chaque PMOD définit lui-même les thématiques des
jeux de données à publier et les données qui seront, ou pas, publiées dans le
respect des directives et lois. Ajoutons à cela le fait que le type de données
disponibles varie en fonction des compétences spécifiques de chaque
collectivité. L’absence de la donnée recherchée reste aujourd’hui un problème
récurrent. Certaines données sont « prises en otage » en absence
d’une obligation de publication (Entretien avec un gestionnaire de PMOD) :
« En fait, dans l’Open data, c’est un peu la métaphore du placard où il
n’y a pas tout ce qu’on veut pour faire le plat qu’on voudrait »
(Entretien avec un développeur). Au-delà d’un simple accès à la donnée,
beaucoup de réutilisateurs soulignent la nécessité de « comprendre le point de
vue du producteur de la donnée : la donnée, ce n’est pas suffisant, il
faut aussi les moyens de l’interpréter et donc des spécifications sur ces
données et éventuellement des rapports sur l’utilité de ces données pour
pouvoir vraiment la mettre en contexte » (Entretien avec un
data-analyste). Toutefois, certains développeurs utilisent les données sans
forcément se poser de questions sur la méthodologie du traitement de la donnée
avant sa publication : « A partir du moment où je peux me dire que
ces données sont relativement bonnes à la rigueur je m’en moque… Ils font leur
travail. Pour moi, c’est une sorte de boite noire, je récupère les données,
pour l’instant cela me va. »
(Entretien avec un développeur).
La compréhension des données est surtout possible grâce aux métadonnées. Or, à
l’heure actuelle, les descriptions de données publiées (termes, mots-clés) et
les métadonnées relatives à la création, aux mises à jour, aux utilisations
sont disparates tant du point de vue sémantique que structurel entre les divers
PMOD. Malgré l’existence de normes et de guides de bonnes pratiques que nous
avons évoqués, chaque producteur fournit ses données dans son format spécifique
sans se soucier des questions de l’exploitabilité. Par exemple, « il
existe en France 7 fournisseurs des données en temps réel lié aux transports
collectifs et 7 formats différents d’API » (Entretien avec un coordinateur
de projet Open Data). Les réutilisateurs professionnels ne peuvent pas
automatiser le traitement des données hétérogènes ce qui les oblige à un
travail plus lourd d’agrégation manuelle et de consolidation afin de pouvoir
répliquer leurs applications à l’échelle de plusieurs collectivités
territoriales. L’accès aux données via les API freine leur emploi, car « une
API est une surcouche qui donne des services en plus qui sont les bienvenus,
mais du coup il y a des restrictions… c’est bien pour un développeur qui veut
tester des usages, mais si l’on veut faire une entreprise derrière, il faut
faire attention parce qu’il peut y avoir des restrictions par rapport au volume
de données utilisées » (Entretien avec un développeur). De plus, les
formats des données disponibles viennent souvent des DSI des collectivités qui
choisissent des formats plus simples ou des formats métiers qui ne sont pas
toujours portés par de professionnels d’autres secteurs. En même temps, le
choix des formats de données reste un choix politique et d’éthique
professionnelle : « si tout le monde utilise GTFS, Google bouffe
tout… » (Entretien avec un gestionnaire de PMOD). Dans ce contexte, le
souhait récurrent des réutilisateurs porte sur la structuration et la
codification homogène et systématique des données des différents PMOD. La mise
en place d’un référentiel multimodal de données permettrait d’harmoniser des
données hétérogènes en ménageant l’interopérabilité afin d’avoir une plateforme
structurée malgré la diversité hébergée. Le portail national data.gouv.fr n’est
qu’en partie considéré comme un outil commun et pour les développeurs, le
meilleur exemple actuel de véritable base commune des données ouvertes
s’appelle OpenStreetMap.
La réutilisation des données ouvertes interroge ainsi les modes de gouvernance,
les modèles économiques et les façons de penser le politique et l’espace public
dans deux registres structurants. D’abord celui de l’accès aux données,
informations et savoirs qui relève de l’ouverture elle-même et ensuite dans
celui de la production-circulation des savoirs et services sous de nouvelles
formes et conditions qui lui, relève de la réutilisation. Les deux sont
totalement interdépendants, car « des métadonnées aux fabrications
(jusqu’aux générations semi-automatiques ou automatiques) d’ontologies et à
leur interopérabilité partielle, ce qui se trame et est en jeu, c’est non
seulement la création de valeurs…, mais aussi différentes façons de concevoir
le travail intellectuel, de concevoir et pratiquer les problèmes liés aux
sociétés ouvertes et démocratiques »[43].
Répondant aux injonctions de la transparence, de l’innovation et de la participation
citoyenne, la démarche de l’ouverture des données croise souvent les
préconisations des promoteurs du concept de « ville intelligente »,
imaginée comme une plateforme d’innovation ouverte, basée sur les nouveaux
services urbains. À la différence des services publics traditionnellement
centralisés et descendants, les services urbains d’une smart-city reposeraient
sur une implication des usagers « à la construction ou à la fourniture
d’une partie du service », tout en considérant les usagers « à la fois
[comme] les unités d’observations, les actants et les bénéficiaires »[44].
Autrement dit, la réutilisation, par des professionnels, des pro-am — et des citoyens marquera la réussite de l’ouverture
des données et sa promesse politique et utopique d’une réutilisation par tous.
Chignard
S., Open data : Comprendre l’ouverture des données publiques,
Paris, FYP Editions, 2012.
Dymytrova V., I. Hare,
« La mise en scène visuelle de l’Open data : enjeux sémiotiques,
communicationnels et politiques », communication au colloque les données urbaines : quelles
pratiques ? Quels savoirs ?, Lyon, 13-14 décembre 2016.
Ibekwé-Sanjuan F., F. Paquienséguy, « Open, Big, Collaboration : trois
utopies de l’innovation au 21e siècle », in E. Broudoux,
G. Chartron (dir.), Big data — Open data : Quelles valeurs ?
Quels enjeux ?, Louvain-la-Neuve, De Boeck
Supérieur, 2015, p. 15.
Falzon P., “Enabling
safety: issues in design and continuous design”, Cognition, Technology
and Work, n°1 (10)/2007, p.7.
Flichy P., L’innovation technique. Récents
développements en sciences sociales. Vers une nouvelle théorie de l’innovation, Paris,
La Découverte, 1995.
Frank M., J. Walker, “User centred methods for measuring the quality of open data”, The Journal of Community Informatics, n°12/2016, p. 47.
Kitchin R., The Data Revolution: Big data, Open data, data infrastructures and their consequences, London, Sage, 2014.
Larroche V., M. Vila, « Urban Data et stratégies dans le secteur des services : Le cas
de la métropole lyonnaise », in E. Broudoux, G. Chartron (dir.), Big data –
Open data : Quelles valeurs ? Quels enjeux ?,
Louvain-la-Neuve, De Boeck Supérieur, 2015, p. 183.
Le Corf J.-B.,
« Management de l’information publique et innovation numérique de services
urbains : l’intelligence territoriale en perspective » in E. Broudoux, G. Chartron (dir.), Big data – Open data : Quelles valeurs ?
Quels enjeux ?, Louvain-la-Neuve, De Boeck
Supérieur, 2015, p. 97.
Kosellek R., Vergangene Zukunft. Zür Semantik geschichtlicher Zeiten, Francfort,
Suhrkamp, 1979.
Marzloff B., Le 5e écran, les médias urbains
dans la ville 2.0, Paris, FYP Editions, 2009.
Norman D. A., S.W. Draper (Eds.). User-centered system design : New perspectives on human-computer interaction, Hillsdale, NJ, Lawrence Erlbaum, 1986.
Noyer
J.-M., M. Carmes, « Le
mouvement “Open data” et les intelligences collectives », in M. Carmes, J.-M. Noyer (dir.), Les débats du
numérique, coll. « Territoires numériques », Paris, Presses des
Mines, 2013, p. 137.
Paquienséguy
F., « À qui profite le chiffre ?
Les portails métropolitains Open Data », in O. Avenati, P.-A, Chardel
(dir.), Datalogie.
Formes et imaginaires du numérique, Editions Loco en coproduction avec
l’ESAD de Reims, 2016, p. 126.
Paquienséguy
F., « Smart city & open
data : à qui profitent les données ouvertes ? », CIST2016 – En quête de territoire(s) ?, Proceedings du 3e colloque international du CIST,
Mars 2016, Grenoble, France., p. 351. https://hal.archives-ouvertes.fr/hal-01353651/.
Paquienséguy F. (dir.),
Open data : Accès, territoires, citoyenneté : des problématiques
info-communicationnelles, Paris, Editions des Archives contemporaines,
2016.
Paquienséguy
F., « Les portails Open Data au prisme du courtage
informationnel : qu’est-ce qui se joue pour les Métropoles ? »,
in Open data : Accès, territoires, citoyenneté : des
problématiques info-communicationnelles, F. Paquienséguy (dir.), Paris,
Editions des Archives contemporaines, 2016.
Turki
S., M. Foulonneau, « Valorisation des données
ouvertes : acteurs, enjeux et modèles d’affaires », in E. Broudoux, G. Chartron (dir.), Big data –
Open data : Quelles valeurs ? Quels enjeux ?,
Louvain-la-Neuve, De Boeck Supérieur, 2015, p. 113.
Yin R. K., Case Study Research. Designs and Methods, Newbury Park, Sage, 2009.
[1] S. Chignard, Open data : Comprendre l’ouverture des données publiques,
Paris, FYP, 2012 ; F. Paquienséguy (dir.), Open data : Accès,
territoires, citoyenneté : des problématiques info-communicationnelles,
Paris, Editions des Archives contemporaines, 2016.
[2]
http://cordis.europa.eu/fp7/ict/content-knowledge/docs/open-data-reuse-incubator
4-3-a.pdf.
[3] S. Turki, M. Foulonneau, « Valorisation des données
ouvertes : acteurs, enjeux et modèles d’affaires », in Big data - Open data: Quelles valeurs? Quels
enjeux?, E. Broudoux, G. Chartron (dir.), Louvain-la-Neuve, De Boeck Supérieur, 2015, p. 113.
[4] R. Kitchin, The Data Revolution: Big data,
Open data, data infrastructures and their consequences, London, Sage, 2014.
[5] D. A., Norman, S.W. Draper (Eds.). User-centered system
design: New perspectives on human-computer interaction, Hillsdale, NJ,
Lawrence Erlbaum, 1986.
[6] « Fostering
Uses and Usages of Open Sensor Data in Smart Cities »:
http://opensensingcity.emse.fr/.
[7] L’enquête
conduite au nom d’Elico EA 4147, par Valérie Larroche-Boutet, Martine Vila, Marie-France Peyrelong, Valentyna Dymytrova et Françoise Paquienséguy
qui en a aussi assuré la direction scientifique. Le panel d’interviewés est
constitué de réutilisateurs inscrits et déclarés comme tels sur des portails
métropolitains. Au total, 22 entretiens ont été menés de septembre 2015 à juin
2016.
[8] Open
Knowledge International, OpenDataHandbook:
http://open datahandbook.org/guide/fr/what-is-open-data/.
[9] F. Ibekwé-Sanjuan, F.
Paquienséguy, « Open, Big,
Collaboration : trois utopies de l’innovation au 21e siècle »,
in E. Broudoux, G. Chartron
(dir.), Big
data - Open data : Quelles valeurs ? Quels enjeux ?, Louvain-la-Neuve, De Boeck Supérieur, 2015, p. 15.
[10] P. Flichy, L’innovation technique. Récents
développements en sciences sociales. Vers une nouvelle théorie de l’innovation,
Paris, La Découverte, 1995.
[11] R. Kitchin, The Data Revolution: Big data,
Open data, data infrastructures and their consequences, London, Sage, 2014,
p. 50.
[12]
Signée le 18 juin 2013 lors du Sommet de Lough Erne, en Irlande du Nord et
disponible ici : http://www.modernisation.gouv.fr/sites/default/files/fichiers-attaches/charte-g8-ouverture-donnees-publiques-fr.pdf.
[13] Etalab, Vade-mecum
sur l’ouverture et le partage de données publiques, Septembre 2013. En
ligne :http://www.enssib.fr/bibliotheque-numerique/documents/61618-vade-mecum-sur-l-ouverture-et-le-partage-des-donnees-publiques.pdf.
[14] Etalab, Vade-mecum
sur l’ouverture et le partage de données publiques, Septembre 2013. En
ligne :http://www.enssib.fr/bibliotheque-numerique/documents/61618-vade-mecum-sur-l-ouverture-et-le-partage-des-donnees-publiques.pdf.
[15] F. Paquienséguy,
« Smart city & open data : à qui profitent les données
ouvertes ? », CIST2016. En quête de territoire(s) ?, Proceedings du 3e colloque international du CIST, Mars
2016, Grenoble, France, p. 351.
https://hal.archives-ouvertes.fr/hal-01353651/.
[16]https://www.europeandataportal.eu/sites/default/files/d2.1.2_training_module_1.5_promoting_the_reuse_of_open_data_through_odip_en_edp.pdf.
[17] http://www.modernisation.gouv.fr/sites/default/files/fichiers-attaches/charte-g8-ouverture-donnees-publiques-fr.pdf.
[18] Par
exemple, Etalab, Vade-mecum
sur l’ouverture et le partage de données publiques, septembre 2013 ; Rapport Trojette
sur l'ouverture des données publique, 2013 ; Rapport sur l’ouverture des données de transport présidé par
Francis Jutand, mars 2015.
[19]« Smart City – « Le défi : créer de
l’intelligence collective ». Entretien avec D. Boullier :
http://www.lemag-numerique.com/2016/01/smart-city-le-defi-creer-de-lintelligence-collective-8337.
[20]
http://www.cada.fr/qu-est-ce-qu-une-reutilisation,6116.html.
[21]
Directive 2003/98/EC du
Parlement européen et du Conseil du 17 novembre 2003 concernant la
réutilisation des informations du secteur public.
[22] Directive 2007/2/CE du Parlement européen et
du Conseil établissant une infrastructure d'information géographique dans la
Communauté européenne.
[23]
D’ailleurs nous avons remarqué dans notre analyse des PMOD que certains avaient
structuré leurs rubriques thématiques en reprenant stricto sensu celles de la directive, c’est le cas de Lyon par
exemple.
[24] Loi
78-753 du 17 juillet 1978, dite loi CADA.
[25]
Ordonnance n° 2005-650 du 6 juin 2005 relative
à la liberté d'accès aux documents administratifs et à la réutilisation des
informations publiques.
[26] Décret n°2005-1755 du 30 décembre 2005 relatif à la liberté d'accès aux documents
administratifs et à la réutilisation des informations publiques, pris pour l'application
de la loi n° 78-753 du 17 juillet 1978.
[27] À
noter une terminologie variée utilisée selon les sources : données
publiques, informations du secteur public ou informations publiques. Comme le
souligne le rapport Trojette, « Au regard des
normes en vigueur, les expressions « donnée publique »,
« information publique » et « information du secteur
public » semblent devoir être considérées comme synonymes (Rapport Trojette,
juillet 2013, p. 16).
[28]
Analyse disponible dans le livrable n°2 : https://hal.archives-ouvertes.fr/hal-01449348.
[29]
www.tuba-lyon.com.
[30] Loi
2014-58 pour la modernisation des territoires et la réaffirmation des
Métropoles (loi dite MAPAM, 2014). Ainsi créée, la Métropole de Lyon devient
une collectivité territoriale à statut particulier au même titre que les
communes, les départements et les régions. Constituée
de 59 communes, la Métropole exerce les compétences du Grand Lyon, celles du
département du Rhône et a la possibilité d’en acquérir d’autres, par
délégation, de la Région ou de l’Etat. Elle a reçu notamment les compétences en
matière d’aménagement de l’espace métropolitain (entretien et gestion des
routes, transports, voiries).
[31] Conçu
par le service Innovation Numérique & des Systèmes d’Information de la
métropole de Lyon, la plateforme technique est entièrement basée sur des
logiciels libres : Linux, Apache/Tomcat, PostgreSQL/PostGIS, MapServer 6. Le
catalogue des données est basé sur l’outil Géosource.
[32] F. Paquienséguy,
« Les portails Open Data au prisme du courtage informationnel : qu’est-ce
qui se joue pour les Métropoles ? », in Open data : Accès,
territoires, citoyenneté : des problématiques info-communicationnelles, F. Paquienséguy (dir.), Paris,
Editions des Archives contemporaines, 2016.
[33] J. -B. Le Corf,
« Management de l’information publique et innovation numérique de services
urbains : l’intelligence territoriale en perspective » in E. Broudoux, G. Chartron (dir.), Big data - Open data : Quelles valeurs ?
Quels enjeux ?, Louvain-la-Neuve, De Boeck
Supérieur, 2015, p. 110.
[34] P. Falzon, “Enabling safety: issues in design and continuous
design”, Cognition, Technology and Work, n°1
(10)/2007, p. 7.
[35] J.-M. Noyer, M. Carmes, « Le
mouvement « Open data » et les intelligences collectives », in M. Carmes, J.-M. Noyer (dir.), Les débats du
numérique, coll. « Territoires numériques », Paris, Presses des
Mines, 2013, p. 151.
[36] http://data.grandlyon.com/connaitre-nos-licences/ (consulté
le 3 février 2017).
[37] Une ville
habitable se laisse approprier et coloniser par ses habitants en tendant à
devenir ville durable, contrairement aux mégapoles contemporaines qui
deviennent inhumaines. Cf. V. Timmer et N. K. Seymoar, La ville habitable, International Centre for Sustainable
Cities, Vancouver, 2005
[38] V. Larroche, M. Vila,
« Urban Data et stratégies dans le secteur des services : Le cas de la
métropole lyonnaise », in E. Broudoux, G. Chartron (dir.), Big data -
Open data : Quelles valeurs ? Quels enjeux ?, Louvain-la-Neuve, De Boeck Supérieur, 2015, p. 183.
[39] F. Paquienséguy,
« Les portails Open Data au prisme du courtage informationnel : qu’est-ce
qui se joue pour les Métropoles ? », in F. Paquienséguy (dir.),
Open data : Accès, territoires, citoyenneté : des problématiques
info-communicationnelles, Paris,
Editions des Archives contemporaines, 2016.
[40] P. Flichy, L’innovation technique. Récents
développements en sciences sociales. Vers une nouvelle théorie de l’innovation,
Paris, La Découverte, 1995, p. 224.
[41] R. Kosellek,
Vergangene Zukunft. Zür
Semantik geschichtlicher Zeiten, Francfort,
Suhrkamp, 1979.
[42] S. Chignard, Open data : Comprendre l’ouverture des données publiques,
Paris, FYP Editions, 2012.
[43] J.-M. Noyer, M. Carmes, « Le
mouvement « Open data » et les intelligences collectives », in Les débats du numérique, M. Carmes, J.-M. Noyer (dir.), coll. « Territoires numériques », Paris,
Presses des Mines, 2013, p. 157.
[44] B. Marzloff, Le 5e écran, les médias urbains
dans la ville 2.0, Paris, FYP Editions, 2009, p.66.