Los cambios a la oferta y la demanda de datos están reestructurando las jerarquías privilegiadas del conocimiento, y los hackers aficionados y la tecnología legible por máquinas se están convirtiendo en una parte central del análisis de estos cambios. Los expertos tradicionales pueden tener la esperanza de una evolución gradual, pero quizás ya está en curso una revolución paralela liderada por profesionales del sector privado. Prasanna Lal Das sostiene que las alianzas tendrán que incorporar a estos nuevos actores porque para ellos la revolución de los datos ya es una realidad.
No se trata de la primera era de la revolución, pero esta se siente que no duraría 100 años. Nuestro mundo se está transformando como por encanto delante de nuestros ojos —algunas veces con más fuerza que otras— y el mundo tradicionalmente poco acogedor de los datos, dominado por los catedráticos y los “expertos”, tampoco ha estado inmune a los cambios. Puede ser incluso la chispa de al menos un cierto fervor revolucionario, especialmente puesto que el Informe del Grupo de Alto Nivel de Personas Eminentes sobre la Agenda para el Desarrollo después de 2015 pidió una “revolución de datos” para “fortalecer los datos y estadísticas con propósitos de rendición de cuentas y toma de decisiones”. Sin embargo, la revolución oficial de los datos se ha desplegado lentamente, a veces haciendo que uno se pregunte si va a ser una revolución de los burócratas, por los burócratas y para los burócratas. O si será una revolución que verdaderamente cambie cómo medimos nuestro mundo, qué medimos en él y quién hace las mediciones.
El mencionado informe describe la revolución en un nivel bastante alto y ha habido considerable trabajo desde entonces para definir lo que esta podría ocasionar y cómo las tendencias emergentes enumeradas (desglose, externalización colectiva, nuevas tecnologías y mejoras en la conectividad, que tienen el potencial de empoderar a los ciudadanos) pueden dar forma a los contornos de la revolución. De manera inevitable, por lo menos parte de la discusión se ha centrado en temas bien conocidos (pero aún importantes), tales como un aumento de las capacidades, un papel más central de las oficinas nacionales de estadística, mayor estandarización de los métodos de recolección de datos, alianzas más inteligentes y, de manera ineludible, más recursos para los organismos estadísticos. Pero ha estado al acecho —como el mismo informe reconoció— el fantasma de los “macrodatos y las nuevas técnicas de manejo de datos, el reconocimiento de que el área de los datos ya pudo haber experimentado una revolución y que algunas preciadas verdades quizás ya no estén vigentes.
Recientemente, asistí a un par de conferencias —una organizada por Webdatanet y la otra por UNECE—donde la revolución, inminente o en curso dependiendo de a quién se le pregunte, estaba muy presente en el ambiente. Estas eran reuniones de expertos con reputación acreditada en la comunidad de datos, y con las herramientas para discernir que el terreno estaba cambiando bajo sus pies. De manera que mientras la calma reinaba en la superficie, muchas preguntas agitaban ambos eventos.
¿Las máquinas ya han tomado el control?
Gran parte de los datos (¿más del 90 %?) del mundo provienen ahora de “máquinas” (sensores, celulares, satélites, cámaras fotográficas, drones, escáneres…) y es probable que el desequilibrio aumente (incluso en las ciencias sociales). Claramente todavía hay un papel para los investigadores en terreno que hablan con la gente y registran fielmente las observaciones, pero los datos que recogen se ven empequeñecidos por lo que las máquinas hacen y pueden recolectar. Hablar de máquinas puede dar miedo, pero estas pueden registrar datos de zonas de guerra, desde regiones inhóspitas, de cerca y de lejos, sobre lo visible y lo invisible, lo hablado y lo no hablado, y lo pueden hacer de manera repetitiva y predecible (¡lamentablemente no hay blogs sobre las increíbles aventuras etnográficas de las máquinas!). Y las máquinas a menudo hacen un mejor trabajo analizando estos datos y consiguiendo que estos tengan sentido, incluso aprendiendo y adaptándose mientras los datos cambian. La segunda economía puede o no estar a punto de golpear al científico de datos, pero —en mi opinión, por lo menos— un revolucionario de los datos que no pregunta “¿pueden hacerlo las máquinas?” al momento de considerar cualquier aspecto de los datos puede haber desaprovechado la revolución.
¿Los bárbaros cruzaron las rejas (acaso no es necesario ser un experto para manejar datos)?
¿Recuerdan los días en que los periodistas atacaban a los blogueros y los medios sociales en general porque los creadores de nuevo contenido no adherían a las normas periodísticas y de estilo cultivadas tan dolorosamente por décadas por los expertos en la materia? ¿O cuando los profesionales del video se burlaban de YouTube? Bien, la misma irrespetuosa masa se ha reunido en torno a los datos: recopilando datos “hágalo usted mismo” y publicándolos, analizándolos y visualizándolos, y compartiendo su trabajo con los profesionales de datos, expertos en políticas, académicos y la sociedad civil por igual. Lo que hace poderosos a estos hackers aficionados de los datos es la familiaridad que tienen con el contexto, su capacidad de hacer las preguntas correctas a partir de los datos y su manera decidida de abordarlos; para estas personas los datos son el medio y no el fin, y de pronto tienen una gran variedad de herramientas de datos para elegir, herramientas que casi transforman en bienes/democratizan muchas habilidades tradicionales de datos. No estoy diciendo que estos aficionados puedan reemplazar a los científicos y expertos en datos, y estos últimos siguen siendo indispensables en muchos contextos, pero el trabajo de estos hackers sí plantea la pregunta de si la verdadera revolución no vendrá de “abajo”, y si los nuevos hackers no son los verdaderos revolucionarios en este campo.
¿Las alianzas de datos tradicionales están perdiendo terreno?
El diálogo sobre la revolución de los datos está dominado en gran medida por las fuerzas tradicionales (¡a pesar de la contradicción en los términos!): sobre todo los organismos oficiales, los reconocidos comités de expertos y las universidades que tienen el mandato de recopilar, curar y distribuir datos esenciales (aunque ha habido esfuerzos concertados para incluir a nuevos actores). Uno podría argumentar —aunque no tengo los números ahora— que la proporción de datos que tales entidades contribuyen a todo el ecosistema de datos ha ido disminuyendo recientemente (debido esencialmente a la explosión de datos de nuevas fuentes). Lo que también ha cambiado es la combinación de los datos: la mayoría de las fuentes “modernas” no son tradicionales (las máquinas mencionadas anteriormente, las redes sociales, los datos administrativos de los estudios, los datos de transacciones de negocios y otros) y muchos organismos oficiales no han desarrollado las habilidades para recopilar y administrar dichos datos (aunque algunos están haciendo esfuerzos en este sentido). La pregunta entonces inevitablemente es si la revolución ya ha dejado a tales instituciones en el camino o si ellas tienen todavía una oportunidad de recuperar el terreno perdido. Me gustaría decir que los organismos oficiales seguirán siendo esenciales, pero algunas alianzas tradicionales puede que tengan que incluir varios rostros nuevos.
¿Todo lo que sabemos sobre los datos es incorrecto?
Déjenme ser claro: no lo es, pero los profesionales de las nuevas técnicas de datos lanzan cotidianamente preguntas provocativas al sistema tradicional: ¿no están muertas las teorías y los modelos?; ¿no es el muestreo una técnica primitiva más adecuada para un mundo con escasez de datos en vez del actual mundo con una abundancia de datos?; ¿son nuestros números favoritos —los así llamados indicadores principales, como el PIB, inflación, empleo, balanza comercial y similares— simplemente inútiles en el mundo moderno?; ¿no son los datos tradicionales demasiado lentos, engorrosos y costosos para ser útiles en un ambiente con gran cantidad de decisiones?; ¿es realmente tan importante como creemos la precisión de los datos? (y, en todo caso, ¿han sido los datos alguna vez muy precisos?) o ¿tenemos que aceptar datos “desorganizados” como la nueva normalidad? Las respuestas a preguntas como estas a veces tienden a ser salidas de tono o, peor aún, despectivas, pero si verdaderamente va a haber una revolución, quizás hay una oportunidad para botar unos pocos manuales antiguos y mantener una mente abierta.
¿Cuál será el valor de una revolución de los datos?
¿Por qué necesitamos una revolución de los datos? Por lo menos parte de la discusión sobre este tema se ha centrado en asuntos del “lado de la oferta”, tales como brechas y calidad de los datos, mejor documentación, infraestructura tecnológica para los datos, usabilidad y apertura, y el desafío de los “macrodatos”. El debate sobre la demanda se ha concentrado en la “evidencia”, la “rendición de cuentas” y la “toma de decisiones”, pero ¿es esta una brecha que los revolucionarios de datos “oficiales” pueden llenar mejor que, digamos, el sector privado? ¿Cuáles son las preguntas que los organismos oficiales pueden responder mejor que el “mercado”? ¿Pueden ayudar a los agricultores anticipando mejor la producción agrícola? ¿Pueden predecir mejor los brotes de enfermedades? ¿Pueden ayudar a los negocios a tomar mejores decisiones de inversión? ¿Pueden realmente ayudar a cerciorarse de que la ayuda va a las personas adecuadas y produce los resultados deseados? Responda “sí”, y eso constituiría verdaderamente una revolución. El sector privado ya ha contestado a la demanda de respuestas para tales interrogantes: puede revisar el trabajo de Climate Corporation. O Metabiota. Estas empresas, y otras como ellas, están construyendo negocios de datos, como antes lo hicieron las compañías de seguros, por ejemplo. En lo que concierne a ellos, la revolución de los datos ya es una realidad.
Los grupos a cargo de la revolución de los datos esperan una transición ordenada, un cambio de orden que siga las reglas actuales, una evolución gradual que progrese hacia una revolución. Sin embargo, fuera del mundo del desarrollo, una revolución paralela ya puede estar en curso.
-----------------------------
Publicado originalmente en el blog “Impacto de las Ciencias Sociales” de la London School of Economics.
-----------------------------
Finanzas del Grupo del Banco Mundial es el punto de acceso en línea a los datos financieros del BIRF, la AIF e IFC. El sitio incluye conjuntos de datos que abarcan préstamos, contratos, fondos fiduciarios, inversiones y estados financieros. Una aplicación móvil relacionada, que le permite “hablar” con nosotros más fácilmente sobre datos operacionales y financieros, en nueve idiomas, puede ser descargada por los usuarios de teléfonos inteligentes y tabletas con sistema Android e iOS en la tienda de Google y en la tienda de iTunes, respectivamente. Síganos en Twitter para unirse y participar en la conversación sobre los datos financieros de libre acceso del Banco.
Únase a la conversación