Publié sur Blog de Données

Le « Big Data » a envahi le monde, mais la révolution des données a-t-elle déjà commencé ?

ImageLes transformations de l'offre et de la demande de données sont en train de bouleverser les hiérarchies du savoir : les hackers amateurs et les technologies d’exploitation de l’information par des machines prennent une place de plus en plus grande dans l’analyse des données. Si les experts traditionnels espèrent une évolution graduelle, une révolution parallèle menée par les professionnels du secteur privé est sans doute déjà en marche. Selon Prasanna Lal Das, les partenariats doivent intégrer ces nouveaux acteurs car, pour eux, la révolution des données est d'ores et déjà une réalité.

Des ères de révolutions, il y en a eu d’autres. Mais celle-ci ne semble pas partie pour prendre un siècle. Notre monde se métamorphose sous nos yeux, parfois de façon brutale, et l’univers des données, dominé par les universitaires et les « experts » et traditionnellement aride, n'est pas épargné par ces changements. Il pourrait même être à l'origine d'une ferveur révolutionnaire, surtout depuis que le Groupe de personnalités de haut niveau chargé d’étudier le programme de développement pour l’après-2015 a appelé dans son rapport à une « révolution des données » pour « renforcer les données et les statistiques utilisées à des fins de prise de décision et de responsabilisation ». La révolution des données officielle met cependant du temps à s'installer, et l'on peut se demander s'il s'agira d'une révolution des bureaucrates, par les bureaucrates et pour les bureaucrates. Ou si, au contraire, cette révolution changera réellement la façon dont nous mesurons notre monde, ce que nous mesurons et qui réalise ces mesures.

Le rapport décrit cette révolution à un niveau relativement élevé, et, depuis sa publication, des efforts remarquables ont été déployés pour définir ce que cette révolution pourrait entraîner et dessiner ses contours compte tenu des nouvelles tendances mises en évidence : la désagrégation des données, le crowdsourcing, les nouvelles technologies et la connectivité, soit autant de phénomènes susceptibles d'autonomiser les citoyens. Assez inévitablement, une partie des discussions se sont focalisées sur des problèmes bien connus (mais non moins importants) : renforcement des capacités et du rôle des bureaux de statistiques nationaux, plus grande normalisation des efforts de collecte des données, partenariats plus « intelligents » et, inéluctablement, nécessité de disposer de plus de ressources pour les organismes de statistiques. Cependant, comme le rapport le reconnaît lui-même, le spectre du « Big Data » et des nouvelles techniques des données plane sur ces évolutions, ce qui suggère que le monde des données pourrait avoir déjà connu une révolution et que certaines vérités considérées comme fondamentales ne sont peut-être déjà plus d'actualité.

J'ai participé récemment à deux conférences, l'une organisée par Webdatanet et l'autre par la Commission économique des Nations unies pour l’Europe, dans lesquelles cette révolution, imminente ou déjà en cours selon les différents points de vue, imprégnait fortement l'atmosphère. Ces deux conférences rassemblaient des experts faisant autorité dans la communauté des professionnels des données et disposant des outils nécessaires pour discerner la profonde mutation en cours. Si ces événements se sont déroulés dans un calme apparent, les questions soulevées étaient bouillonnantes.

Les machines ont-elles déjà pris le pouvoir ?

La plupart des données (plus de 90 % ?) recueillies dans le monde proviennent désormais de « machines » (capteurs, téléphones mobiles, satellites, caméras, drones, scanners, etc.), et ce déséquilibre devrait continuer à se creuser, y compris dans les sciences sociales. S'il est certain que les chercheurs de terrain doivent continuer à discuter avec les populations et à enregistrer fidèlement leurs observations, les données qu'ils recueillent sont dérisoires par rapport à ce que les machines font et peuvent collecter. On peut s’alarmer de la place de la machine, mais il faut penser à ce que la machine est capable de faire : enregistrer des données dans les zones de guerre et les régions inhospitalières, de près comme de loin, dans le visible et l'invisible, à partir d'échanges verbaux et non verbaux, le tout de façon répétitive et prévisible (hélas, il n'existe pas de blog sur les aventures ethnographiques incroyables que vivent les machines !). De plus, les machines sont souvent en mesure de mieux analyser et interpréter ces données, et sont même capables d'apprendre pour s'adapter à leurs évolutions. Que la nouvelle économie affecte ou pas les scientifiques des données, mon avis est le suivant : celui qui travaille avec les données sans se demander systématiquement si une machine pourrait « le faire », passe à côté de la révolution en cours.

Les barbares sont-ils entrés dans la cité ?

Rappelez-vous de l'époque où les journalistes s'insurgeaient contre les blogueurs et les médias sociaux parce que ces nouveaux créateurs de contenus ne respectaient pas les normes journalistiques et stylistiques entretenues si laborieusement depuis des décennies par les experts de la profession. Ou lorsque les professionnels de la vidéo se moquaient de YouTube. Eh bien, la même masse d’« intrus » s’est rassemblée pour recueillir elle-même des données et les publier, les analyser et les visualiser, et partager les fruits de son travail aussi bien avec des professionnels des données que des conseillers politiques, des universitaires et des membres de la société civile. La grande force de ces hackers amateurs réside dans leur connaissance intime du contexte, leur capacité à poser les bonnes questions aux données et leur approche ciblée. Pour eux, les données sont un moyen et non une fin en soi, et voilà qu’ils ont soudainement à leur disposition des outils qui banalisent et démocratisent bon nombre des compétences traditionnellement associées à l’exploitation de l’information. Je ne dis absolument pas que ces amateurs peuvent remplacer les scientifiques et les spécialistes des données, ces derniers restant indispensables dans ce nombreux cas. Mais le travail de ces hackers devrait nous inciter à nous demander si la vraie révolution ne va pas venir d'en bas et si les nouveaux hackers ne sont pas les véritables acteurs de la révolution des données.

Les alliances traditionnelles sont-elles en train de perdre du terrain ?

Paradoxalement, les discussions portant sur la révolution des données sont largement dominées par les acteurs traditionnels, qui se composent principalement des organismes officiels, groupes de réflexion reconnus et universités qui ont pour mission de collecter, traiter et distribuer les données essentielles (bien qu'un effort concerté ait été engagé pour inclure de nouveaux acteurs). Même si je ne dispose pas des chiffres à l'heure actuelle, on peut avancer que, à l'échelle de l'écosystème des données tout entier, la part des données fournies par ces entités a décliné au cours de la période récente, ce qui est essentiellement attribuable à l'explosion de la quantité de données provenant de nouvelles sources. Ce qui a également changé, c'est la diversité des données : la plupart des sources de données « modernes » sont non traditionnelles (les machines citées plus haut, les médias sociaux, les paradonnées, les données relatives aux transactions commerciales, etc.), et nombreux sont les organismes officiels qui n'ont pas encore développé les compétences requises pour recueillir et gérer de telles données (même si certains font des efforts dans ce sens). La révolution des données aurait-elle donc déjà laissé ces organismes sur le bord de la route ? Ou ont-ils encore une chance de rattraper leur retard ? À mon avis, les organismes officiels continueront à jouer un rôle vital mais certains partenariats traditionnels pourraient intégrer de nouveaux acteurs.

Toutes nos connaissances sur les données sont-elles fausses ?

Je tiens à dire clairement que non. Toutefois, les personnes qui ont recours aux nouvelles techniques de données posent régulièrement des questions provocatrices à l'establishment des données : les théories et les modèles ne sont-ils pas obsolètes ? L'échantillonnage n'est-il pas une technique primitive, plus adaptée à un monde pauvre en données qu'au monde actuel où elles abondent ? Les chiffres que nous affectionnons tant, comme le PIB, l'inflation, le chômage, la balance commerciale, etc., ne sont-ils pas tout bonnement inutiles dans le monde moderne ? Les données traditionnelles ne sont-elles pas trop lentes, laborieuses et coûteuses à obtenir pour être efficaces dans un environnement où d'innombrables décisions doivent être prises rapidement ? La précision des données est-elle aussi importante qu'on le croit (si tant est que les données aient jamais été vraiment précises), ou devons-nous accepter les données « désordonnées » comme la nouvelle norme ? On répond généralement à ces questions avec automatisme ou, pire encore, avec mépris, mais si une révolution s'annonce bel et bien, il pourrait être souhaitable de se débarrasser de quelques vieux principes et conserver une certaine ouverture d'esprit.

Quelle serait la valeur ajoutée d'une révolution des données ?

Pourquoi avons-nous besoin d'une révolution des données ? Les discussions sur le sujet se sont en partie concentrées sur les problèmes vus du côté de l’offre, notamment le manque de données et leur mauvaise qualité, la nécessité de mieux les documenter, l'infrastructure technologique pour les gérer, leur utilisabilité et leur ouverture, et les défis inhérents aux données massives ou « big data ». Les discussions portant sur la demande se sont quant à elles focalisées sur des aspects liés au besoin d’éléments probants, à la responsabilisation et à la prise de décision. Mais les tenants « officiels » de la révolution des données sont-ils mieux à même de combler ces lacunes que, par exemple, le secteur privé ? À quelles questions les organes officiels peuvent-ils répondre plus efficacement que « le marché » ? Peuvent-ils aider les agriculteurs à mieux anticiper les rendements agricoles ? Peuvent-ils mieux prévoir les épidémies ? Peuvent-ils aider les entreprises à prendre de meilleures décisions d'investissement ? Peuvent-ils vraiment contribuer à ce que l'aide profite aux bonnes personnes et produise les résultats souhaités ? La réponse est oui, et cela constituerait indéniablement une révolution. Le secteur privé a déjà répondu à la demande de réponses à ces questions, comme en témoignent par exemple les travaux de Climate Corporation ou de Metabiota. Ces sociétés, et d'autres comme elles, développent des activités commerciales basées sur les données, comme l'ont fait avant elles les compagnies d'assurance. Pour ces entreprises, la révolution des données est déjà une réalité.

Les organisations chargées de la révolution des données espèrent une transition ordonnée, un changement de l'ordre des choses qui suive les règles actuelles, une évolution graduelle qui aboutisse à une révolution. Mais il y a, en dehors du monde du développement, une révolution parallèle déjà en marche.

-----------------------------

Billet initialement publié sur le blog de la London School of Economics sur l'impact des sciences sociales.

-----------------------------

Le site des données financières du Groupe de la Banque mondiale est le point d'accès en ligne aux données financières de la BIRD, l'IDA et l'IFC. Il comporte des séries de données qui couvrent les prêts, les contrats, les fonds fiduciaires, les investissements et les états financiers. Une application mobile associée, qui vous permet de nous « parler » facilement et en neuf langues des données opérationnelles et financières de la Banque, est disponible en téléchargement pour les smartphones et tablettes Android et iOS, respectivement sur le Google Store et iTunes. Suivez-nous sur Twitter pour participer aux discussions portant sur les données financières en libre accès de la Banque.


Auteurs

Prasanna Lal Das

Lead Knowledge Management Officer, Trade & Competitiveness

Prenez part au débat

Le contenu de ce champ est confidentiel et ne sera pas visible sur le site
Nombre de caractères restants: 1000