Datos abiertos, ¿una medicina contra la pandemia?

150

Jaime García, Director de Proyectos del Índice de Progreso Social e Investigador de CLACDS/INCAE

6 de agosto de 2020. Vivimos en la era de la información, estamos inundados de datos, de hecho, cada día en internet se generan 500 millones de tweets, 294 mil millones de correos electrónicos, 65 mil millones de mensajes de WhatsApp o 5 mil millones de búsquedas. Estos datos alimentan un espacio digital que en número de bytes se tienen 40 veces más bytes que estrellas en el universo observable, la unidad que se usa a estos niveles es zettabyte, un número con 21 ceros (1,000,000,000,000,000,000,000 bytes).

Estas capacidades digitales no sólo implican cantidad, también significan inmediatez y disponibilidad; características que durante la pandemia nos han permitido darle un seguimiento día con día a la evolución de la enfermedad prácticamente caso por caso en 188 países. Esta disponibilidad de datos se ha logrado con múltiples esfuerzos, destacando principalmente el de la Universidad John’s Hopkins y su centro de recursos sobre el Coronavirus.

Alrededor del mundo este acceso y manejo de datos ha permitido generar herramientas e iniciativas que producen valor a partir de las estadísticas para atender y entender la crisis que la pandemia ha generado. Por ejemplo: modelos predictivos para visualizar y cuantificar el avance y comportamiento de la pandemia; análisis de impactos sanitarios diferenciados por comunidadraza o género; medición de la movilidad para identificar los patrones de contagio del virus; o para generar alianzas público privadas que permitan la adopción de soluciones tecnológicas en las estrategias nacionales.

En ese sentido, y en el contexto de la pandemia, el tener datos estadísticamente robustos, creíbles, relevantes, recientes, y en formatos accesibles va más allá de un instrumento de comunicación y rendición de cuentas, pues estos datos tienen el potencial de transformarse en un insumo estratégico para la generación de herramientas, acciones y colaboraciones que ayudan a los países a mejorar su respuesta ante la crisis global que enfrentamos.

Sin embargo, no todos los datos públicos tienen el potencial de ser herramientas de impacto y colaboración, tienen que cumplir con ciertas características definidas a nivel mundial a través  del concepto de “Datos Abiertos”; es decir, datos a los que cualquiera puede acceder, usar y compartir. Los datos abiertos en general tienen que cumplir con criterios básicos como:

  • Completos: Las bases de datos deben de estar disponibles de forma completa, sin cortes, cálculos, o interpretaciones, respetando las normativas de privacidad y seguridad.

  • Granulares: Los datos deben de estar ligados a la fuente de origen, con el mayor nivel de granularidad posible, no en forma agregada o modificada.

  • Actuales: Los datos deben estar disponibles en su versión más reciente posible para preservar su valor.

  • Accesibles: Los datos deben de estar disponibles para la mayor cantidad de usuarios y para la mayor cantidad de usos. Los datos no son accesibles si requieren de formularios web, o tipos específicos de navegadores, o si no se permite el acceso a herramientas automatizadas debido a un archivo de verificación de robots.

  • Automatizables: Los datos deben de ser accesibles por mecanismos automatizados que faciliten el acceso y análisis de estos.

  • Incluyentes: Se debe permitir el acceso anónimo a los datos públicos.

  • Formatos libres: Los datos se presentan en un formato en el que ninguna entidad tiene un control exclusivo.

  • Sin licencia de propiedad: Los datos no están sujetos a ningún reglamento de derechos de autor, patente, marca registrada o secreto comercial. Pero aplican restricciones de privacidad y seguridad de acuerdo con las normativas nacionales.

Si se consideran estos criterios generales para evaluar el desempeño de la región, se encuentra que de acuerdo al Global Open Data Index publicado por la Open Knowledge Foundation, se encuentra que Brasil es el mejor de América Latina con la octava posición a nivel mundial,  México el segundo en la posición 11, Colombia el tercer en el lugar 14, y el mejor de América Central es El Salvador en el lugar 49, Guatemala en el lugar 56, Panamá en el lugar 61 y Costa Rica en el lugar 64; Nicaragua y Honduras no fueron evaluados.

En otra iniciativa para medir el grado de apertura de los datos públicos los resultados no son muy diferentes, pues usando la información del Barómetro de Datos Abiertos de la World Wide Web Foundation, se encuentra que con una calificación de 0 a 100, Costa Rica obtiene 31 puntos, Panamá 30 puntos, y Guatemala 26 puntos; mostrándose muy rezagados de los líderes latinoamericanos como México con 69 puntos, Colombia con 52 y Brasil con 50 puntos.

En general América Central tiene un rezago serio en la generación de datos abiertos, y es que aunque los datos se producen en la mayoría de los temas relevantes como información geográfica, de registros de propiedad, datos censales, presupuestal, gastos del gobierno, legislativos, de infraestructura, de comercio, de salud, de educación, de seguridad, ambientales, electorales, de contrataciones públicas, de registros de empresas, o de actividad económica; no se cumplen del todo los criterios mencionados anteriormente.

Este rezago en apertura de datos durante una crisis multidimensional como la que ha disparado la pandemia COVID-19, hace que el trabajo coordinado entre sectores, instituciones y ciudadanos sea menos efectivo y limitado en el uso de herramientas tecnológicas o abordajes innovadores; caso contrario de lo que ha pasado en otras regiones y países. En otras palabras, una vez más esta coyuntura global ha desnudado las carencias de nuestros sistemas y procesos; pues seguimos sin entender que los datos públicos pueden ser el oro o petróleo del siglo XXI, pero con la ventaja de que pueden ser usados por muchas personas en cualquier momento, y no pierden su valor, pues los datos abiertos son evaluados de acuerdo con su capacidad de ser usados sin limitaciones.

Finalmente la pandemia está lejos de terminar y las crisis sociales y económicas que la acompañan seguirán presentes en el corto y mediano plazo. En ese sentido, hay una oportunidad para pasar a un modelo en el que los datos y estadísticas públicas dejen de ser vistos como productos cerrados y aislados, empezando con los datos de salud de la pandemia y los datos de las afectaciones económicas y sociales; y más bien se generen plataformas de datos abiertos que pueden ayudar a generar confianza, transparencia, información, conocimiento, aplicaciones, y herramientas que sirvan para acelerar los procesos de reconstrucción y recuperación. La gran crisis del siglo XXI requiere respuestas acordes al siglo XXI.