Curso de datos - Modulo 1

Contenido del Módulo 1:
¿Qué son los Datos Abiertos?
Definición de datos abiertos
“Todos aquellos datos primarios o sin procesar, que se encuentran en formatos estándar e interoperables que facilitan su acceso y reutilización, los cuales están bajo la custodia de las entidades públicas o privadas que cumplen con funciones públicas y que son puestos a disposición de cualquier ciudadano, de forma libre y sin restricciones, con el fin de que terceros puedan reutilizarlos y crear servicios derivados de los mismos”.
Ejemplos de datos abiertos en diferentes sectores
El sector público es una fuente principal de datos abiertos, produciendo una gran variedad de información de interés para ciudadanos y empresas. A continuación, algunos ejemplos por sector:
Gobierno y Sector Público: Datos sobre presupuestos, gasto público, contrataciones, resultados electorales, estadísticas demográficas y socioeconómicas.
Medio Ambiente: Datos sobre calidad del aire y del agua, niveles de polen, previsiones meteorológicas y datos climáticos.
Transporte: Horarios y rutas de transporte público en tiempo real, ubicación de estaciones de bicicletas públicas, estado del tráfico.
Salud: Estadísticas sobre enfermedades, ubicaciones de centros de salud, datos de ensayos clínicos (anonimizados).
Cultura y Ocio: Catálogos de museos, bibliotecas y archivos, información sobre eventos culturales.
Ciencia e Investigación: Datos de investigaciones científicas, como los datos del genoma humano o datos astronómicos.
¿Qué no es un Dato Abierto?
No todos los datos que se encuentran en línea son datos abiertos. A continuación, se detallan las exclusiones:
Datos privados o confidenciales: Esto incluye información personal que puede identificar a un individuo, secretos comerciales o información clasificada por motivos de seguridad nacional. La publicación de esta información está restringida por normativas de protección de datos.
Datos con restricciones de acceso o uso: Si para acceder o utilizar los datos se requiere un pago, un registro, o si existen limitaciones sobre cómo se pueden usar (por ejemplo, sólo para fines no comerciales), no se consideran datos abiertos.
Datos cerrados o propietarios: Son datos controlados por una entidad que restringe su uso y distribución a través de licencias propietarias o barreras tecnológicas. Suelen estar en formatos que dificultan su reutilización.
Características de los Datos Abiertos
Para que los datos sean considerados "abiertos", deben cumplir con ciertas características:
Accesibilidad: Deben estar disponibles en su totalidad y sin coste, preferiblemente para ser descargados a través de internet. No deben existir barreras de acceso como registros o pagos.
Reutilizabilidad: Los datos deben ser proporcionados bajo términos que permitan su reutilización y redistribución, incluyendo la combinación con otros conjuntos de datos. Esto se logra mediante el uso de formatos legibles por máquina y no propietarios.
Interoperabilidad: Los datos deben estar estructurados de manera que puedan ser fácilmente integrados con otros conjuntos de datos, lo que permite desarrollar aplicaciones y análisis más complejos.
Actualización: Los datos deben mantenerse actualizados regularmente para que conserven su relevancia y utilidad a lo largo del tiempo.
Criterios para la Calidad de los Datos Abiertos
La calidad es fundamental para que los datos abiertos sean realmente útiles:
Completitud: Los datos deben cubrir de manera exhaustiva el tema o área que representan, sin omisiones significativas.
Exactitud: Los datos deben ser precisos y estar libres de errores para que las conclusiones que se extraigan de ellos sean fiables.
Temporalidad: Los datos deben ser actuales y relevantes para el período de tiempo que describen, y la frecuencia de actualización debe ser clara.
Consistencia: Los datos deben ser coherentes en su estructura y contenido a lo largo del tiempo y entre diferentes conjuntos de datos.
Comprensibilidad: Deben ser fáciles de entender y utilizar, lo que se logra a través de una buena documentación y el uso de metadatos claros.
¿Por qué Abrir Datos?
La apertura de datos genera múltiples beneficios para la sociedad:
Transparencia gubernamental: Permite a los ciudadanos supervisar las acciones del gobierno, fomentando la rendición de cuentas y combatiendo la corrupción.
Participación ciudadana: Empodera a los ciudadanos al proporcionarles la información necesaria para participar de manera más informada en los asuntos públicos y en la toma de decisiones.
Innovación y desarrollo económico: La reutilización de datos abiertos puede generar nuevos productos, servicios y modelos de negocio, impulsando la economía.
Mejora de servicios públicos: El análisis de datos abiertos puede ayudar a las administraciones a optimizar sus servicios y a responder de manera más eficaz a las necesidades de la ciudadanía.
¿Cómo Abrir Datos?
El proceso de apertura de datos implica una serie de pasos estructurados:
Identificación de los datos a abrir: Priorizar los conjuntos de datos que son de mayor interés y utilidad para el público.
Preparación y limpieza de datos: Asegurar la calidad de los datos, eliminando errores, inconsistencias y datos sensibles.
Selección de formatos y estándares adecuados: Utilizar formatos abiertos y legibles por máquina como CSV, JSON o XML.
Publicación en plataformas accesibles: Utilizar portales de datos abiertos que faciliten el acceso y la descarga de los datos.
Mantenimiento y actualización de los datos: Establecer un plan para la actualización periódica de los datos y para la corrección de errores que se puedan detectar.
Uso Social de los Datos
El verdadero valor de los datos abiertos se materializa cuando son utilizados por la sociedad, grupos de valor. Casos de estudio de éxito:
En Argentina, se utilizaron datos abiertos sobre la ubicación de árboles alergénicos para ayudar a personas con problemas respiratorios a elegir dónde vivir.
En Buenos Aires, el chatbot "Boti" utiliza datos abiertos para responder a las solicitudes de los ciudadanos.
"Caminos de la Villa" en Argentina mapea los barrios más pobres utilizando datos generados por la comunidad para visibilizar sus necesidades.
Impacto en la sociedad y en la toma de decisiones: Los datos abiertos pueden mejorar la transparencia, capacitar a los ciudadanos para tomar mejores decisiones y exigir cambios, y ayudar a resolver problemas públicos importantes.
Palabras Claves
Datos Abiertos, Open Data, Transparencia, Participación Ciudadana, Reutilización de Datos, Formatos Abiertos, Calidad de Datos, Metadatos.