La producción y el uso de datos sobre el desarrollo han experimentado importantes transformaciones en las últimas dos décadas. La transición de los registros en papel a formatos digitales ha hecho que los datos sean más accesibles y fáciles de compartir. Gracias al movimiento de datos abiertos, hoy en día es mucho más fácil acceder a datos de Gobiernos e instituciones, lo que a su vez ha generado más oportunidades para el análisis, la transparencia y la innovación. Asimismo, los importantes avances en materia de macrodatos y ciencia de datos han permitido incrementar aún más el volumen y la diversidad de la información que orienta las políticas de desarrollo.
En medio de los rápidos avances de la inteligencia artificial (IA), los datos sobre el desarrollo han llegado ahora a otro punto crucial: la evolución hacia datos sobre el desarrollo preparados para la IA, es decir, datos fácilmente localizables, comprensibles, accesibles y utilizables tanto para los seres humanos como para las aplicaciones de IA.
¿Por qué hablamos de datos preparados para la IA?
La IA, en particular los modelos de lenguaje de gran tamaño, está transformando por completo la manera en que las personas interactúan con los datos. Los usuarios de datos de todos los niveles de experiencia y conocimientos —desde los principiantes hasta los avanzados— ahora pueden formular preguntas complejas en lenguaje natural a los chatbots y esperar que estos encuentren, interpreten y presenten rápidamente información basada en datos a través de respuestas concisas y precisas.
Para que esta evolución tenga éxito, los sistemas de IA deben funcionar correctamente. Esto significa que los datos que estos manejan e interpretan deben primero evaluarse, validarse, estructurarse, gestionarse y compartirse de manera que respalden el uso responsable y eficaz de la IA. En resumen, los datos deben estar “preparados para la IA”.
Los datos preparados para la IA no sustituyen avances, conceptos fundacionales ni estándares anteriores —como los principios fundamentales de las estadísticas oficiales, los marcos de datos de libre acceso o los principios FAIR (sigla en inglés equivalente a “encontrables, accesibles, interoperables y reutilizables”)—, sino que se basan en ellos. Al ampliar las bases y los estándares establecidos, implican que los datos sobre el desarrollo están siempre abiertos, y son descubribles y reutilizables, y garantizan que estén organizados sistemáticamente y bien documentados, a fin de que tanto las personas como los sistemas de IA puedan utilizarlos de manera continua. Por lo tanto, garantizar la preparación para la IA puede acortar la distancia entre los datos sobre el desarrollo y la toma de decisiones para mejorar las políticas y acelerar la innovación, lo que contribuye a democratizar la información sobre el desarrollo. El Banco Mundial, en sus esfuerzos por convertirse en un “banco de datos” mejor y más grande, ya está trabajando para que esto suceda, en colaboración con los países asociados y la comunidad mundial del desarrollo.
Los argumentos a favor de los datos preparados para la IA
La IA generativa se ha convertido en una interfaz clave para las personas que buscan información sobre distintos temas, entre ellos los relacionados con el desarrollo. Plataformas como AI Overview (de Google), Bing (de Microsoft), Perplexity.AI y ChatGPT (de OpenAI) recorren internet y combinan distintas fuentes de información para generar respuestas a las consultas de los usuarios. Desde luego, el desafío consiste en lograr que las respuestas de la IA sean tan confiables como los datos que las alimentan. Y la realidad es que estos sistemas con frecuencia recurren a contenidos generales de internet (incluidas fuentes no comprobadas) o resultados de búsquedas en la web, en lugar de dar prioridad a fuentes de datos autorizadas, como el Banco Mundial o las oficinas nacionales de estadística.
Dado que los sistemas actuales de IA a menudo seleccionan fuentes de datos sobre el desarrollo que no son óptimas, los usuarios encuentran regularmente respuestas obsoletas o incorrectas, incluso cuando se dispone de información precisa. Esto resulta problemático, ya que la mayoría de las respuestas de la IA tienen toda la apariencia de ser confiables, incluso cuando se trata de alucinaciones.
Es importante subrayar que los datos fidedignos y de alta calidad sobre el desarrollo no son escasos. En otras palabras, las herramientas de IA no necesitan recurrir a fuentes de datos subóptimas para elaborar respuestas a las consultas sobre temas de desarrollo. Lo que falta es un marco estandarizado y una infraestructura sólida que permitan a las herramientas de IA encontrar datos de desarrollo confiables de fuentes autorizadas, acceder a ellos y utilizarlos, todo de manera sistemática, para ofrecer respuestas precisas a las preguntas de los usuarios.
Los datos sobre el desarrollo preparados para la IA pueden ayudar a superar este problema de integridad de la información. Para lograr que la IA acceda a datos confiables sobre el desarrollo y los utilice de manera continua, los Gobiernos, las organizaciones internacionales y el sector privado deben adoptar protocolos y normas de interoperabilidad. Esto ayudará a respaldar la toma de decisiones basada en evidencias, ampliará el acceso público a información confiable y promoverá la confianza en fuentes autorizadas de datos y estadísticas sobre el desarrollo.
¿En qué consisten los datos “preparados para la IA”?
Los datos sobre el desarrollo preparados para la IA se organizan sistemáticamente y se documentan minuciosamente para garantizar que su significado y contexto resulten claros no solo para los expertos en la materia, sino también para los usuarios en general y los sistemas de IA. Se apoyan en tres pilares básicos:
- Sistemas de datos preparados para la IA: La infraestructura básica —que abarca plataformas de descubrimiento, interfaces de programación de aplicaciones (API) y estándares técnicos— garantiza que los datos no solo se almacenen, sino que también sean fácilmente localizables, interoperables y accesibles.
- Datos y metadatos de alta calidad: Se trata de datos confiables, actualizados y debidamente documentados, acompañados de metadatos completos y estructurados. En el caso de las aplicaciones de IA, esto implica conjuntos de datos organizados sistemáticamente y descritos con suficiente especificidad para garantizar que tanto los analistas automáticos como los humanos puedan interpretar la información de manera precisa.
- Gobernanza sólida y alianzas estratégicas: La implementación de políticas integrales, procedimientos estandarizados y esfuerzos colaborativos entre sectores resulta esencial para garantizar la integridad de los datos, mejorar la transparencia y promover el uso responsable. Estas medidas son fundamentales para promover la confianza pública tanto en la sociedad en general como entre quienes desarrollan y aplican los sistemas de IA.
Gracias a estos elementos fundamentales, los datos sobre el desarrollo constituyen un activo accesible para todas las partes interesadas. Los datos preparados para la IA permiten ampliar el acceso público, propiciar conocimientos avanzados a través de la IA y facilitar una toma de decisiones más rápida e informada en toda la sociedad.
Hacer realidad los datos preparados para la IA
Para poner en práctica estos pilares fundamentales, debemos traducir los principios en medidas prácticas. Los datos sobre el desarrollo adoptan diversas formas, por ejemplo, indicadores, microdatos y conjuntos de datos geográficos. Si bien las siguientes recomendaciones pueden adaptarse a diferentes tipos de datos, están especialmente orientadas a los indicadores.
1. Sistemas de datos preparados para la IA
Descubrimiento de datos: incorporar capacidades de búsqueda tanto semántica como léxica para permitir que los usuarios y los sistemas de IA identifiquen datos relevantes a partir del sentido y de palabras clave. Proporcionar soporte para búsqueda multilingüe y asegurarse de que los resultados sean accesibles en formatos que permiten la lectura automatizada a través de API.
Accesibilidad de los datos: implementar estándares abiertos y procesables automáticamente, como SDMX, acompañados de documentación completa de la API y metadatos sólidos, a fin de que los sistemas de IA puedan interpretar e integrar datos de manera eficiente. Garantizar que los datos estén disponibles bajo licencias de datos de libre acceso permisivas.
Interoperabilidad de la IA: emplear estándares abiertos, como el Protocolo de Contexto Modelo, para permitir que los sistemas de IA identifiquen e interpreten de manera eficiente fuentes de datos confiables. Garantizar la transparencia y supervisar el contexto y el uso de los datos.
El Grupo de Gestión de Datos sobre el Desarrollo y la Oficina de la Estadística en Jefe del Banco Mundial están invirtiendo activamente en estos ámbitos, lo que incluye la puesta a prueba de herramientas de búsqueda avanzada (i), el desarrollo de modelos de integración para contextos de bajos recursos (i), la integración de API (i) y el desarrollo de un servidor de protocolo de contexto modelo (i) para respaldar la nueva plataforma Data360 y otros conjuntos de datos seleccionados.
2. Datos y metadatos de alta calidad
Aseguramiento de la calidad de los datos: realizar una validación integral de los datos en todas las etapas, empleando procesos de verificación automatizados junto con metodologías de detección de anomalías. Asegurarse de que el personal reciba una capacitación exhaustiva en gestión de la calidad de los datos, ya que contar con un sólido proceso de aseguramiento de la calidad de los datos es fundamental para los análisis realizados por humanos y los basados en IA.
Múltiples formatos de difusión: proporcionar datos en una variedad de formatos abiertos, como CSV, Parquet, Arrow, JSON y API, para satisfacer las diversas necesidades de los usuarios y facilitar la integración sin contratiempos en los flujos de trabajo de IA.
Uso de estándares de metadatos: aplicar estándares internacionales de metadatos y mantener todos los metadatos del conjunto de datos actualizados y completos.
Estándares sólidos de metadatos: formular e implementar pautas integrales y específicas para generar metadatos estructurados, utilizando herramientas de IA para llevar a cabo procesos automatizados de aseguramiento y mejora de la calidad.
Herramientas de gestión: invertir en plataformas y tecnologías avanzadas que permitan la validación de datos y metadatos, así como una sólida gestión de datos y metadatos a escala, aprovechando las soluciones de IA.
El Banco Mundial, a través de sus programas de trabajo Calidad de los Datos e IA para los Datos/Datos para la IA, promueve estas iniciativas proporcionando recursos de código abierto, como el editor de metadatos (i), directrices integrales para crear metadatos de alta calidad y marcos piloto en los que se aprovecha la IA (i) para evaluar y mejorar la calidad de los metadatos (i) de manera eficiente.
3. Gobernanza y asociaciones
Cumplimiento de la políticas y rendición de cuentas: implementar políticas sólidas que promuevan estándares rigurosos de calidad de los datos y metadatos, la transparencia y el libre acceso. Supervisar periódicamente el uso por parte de terceros y establecer mecanismos eficaces de retroalimentación.
Ética y privacidad: integrar consideraciones éticas y salvaguardas de privacidad en cada etapa del manejo de datos, realizar evaluaciones de impacto integrales y garantizar la transparencia con respecto a las metodologías analíticas y las fuentes de los datos.
Colaboración internacional: facilitar la armonización de las normas y la terminología a través de iniciativas coordinadas, mejorar los procesos de asistencia técnica y desarrollar herramientas y recursos integrales compartidos.
Interacción con el sector privado: fomentar asociaciones colaborativas con empresas de tecnología para promover el desarrollo de herramientas de IA basadas en datos confiables y bien gestionados. Iniciar proyectos piloto conjuntos, difundir las mejores prácticas establecidas y abogar por una mayor transparencia en todas las iniciativas. Asimismo, respaldar la creación de soluciones de IA de bajo costo para garantizar la accesibilidad a organizaciones que enfrentan limitaciones significativas de recursos.
El Banco Mundial está estableciendo alianzas entre organizaciones internacionales —entre ellas, la Comisión de Estadística de las Naciones Unidas, el Fondo Monetario Internacional, la Organización para la Cooperación y el Desarrollo Económicos y el Banco Africano de Desarrollo—, países y el sector privado con el objetivo de promover la gobernanza y la adopción de normas y mecanismos globales (i) para gestionar eficazmente los datos sobre el desarrollo y utilizarlos con sistemas de IA.
¿Por qué la preparación de la IA para el desarrollo de datos es única?
Los datos sobre el desarrollo difieren de la mayoría de los datos del sector privado, puesto que deben satisfacer las necesidades de diversos usuarios, entre ellos Gobiernos, organizaciones, investigadores, la sociedad civil, las empresas y el público. Se tratan como datos con fines públicos, por lo cual requieren apertura, transparencia y rendición de cuentas. Dado que influyen en las decisiones sobre políticas e inversiones en los distintos países y sistemas, la interoperabilidad y la documentación exhaustiva resultan esenciales.
El uso y la reutilización continuos de los datos sobre el desarrollo generan un valor combinado. Si los preparamos para la IA y los hacemos accesibles para soluciones basadas en IA tanto en el sector público como en el privado, aumentaremos su impacto, promoveremos una distribución más equitativa de los beneficios y fortaleceremos la confianza en que se utilizarán de manera responsable. La IA puede ayudarnos a generar un valor económico y social más amplio y potencialmente transformador a partir de los datos, potenciando nuestros esfuerzos por mejorar vidas, impulsar el desarrollo económico y poner fin a la pobreza.
Un llamado a la acción
Adaptar los datos sobre el desarrollo para que sean compatibles con la IA es una tarea urgente y de gran alcance. Para lograr este objetivo se requerirán:
inversiones en infraestructura de datos, el desarrollo de habilidades y la adopción de estándares globales relacionados con los sistemas de datos, los metadatos y la gobernanza;
la cooperación entre Gobiernos, organizaciones internacionales y el sector privado para facilitar el intercambio de mejores prácticas y mantener la alineación estratégica;
innovación y flexibilidad continuas, dada la naturaleza evolutiva de las tecnologías de IA y las necesidades de los usuarios.
Alentamos a las oficinas nacionales de estadística, los productores de datos, los encargados de formular políticas y los asociados tecnológicos a participar en esta iniciativa. A través de esfuerzos colaborativos y la necesaria adopción de estándares globales de calidad de los datos, podemos garantizar que los datos sobre el desarrollo sigan siendo un recurso confiable, inclusivo y sólido para el bienestar común a medida que avanzamos hacia la era de la IA.
Trabajemos juntos para preparar los datos sobre el desarrollo de cara al futuro y garanticemos que sus beneficios sean accesibles para todos.
Únase a la conversación