miércoles, 15 de febrero de 2012

Resumen - II Jornadas sobre Reutilización de la Información del Sector Público

 #RISP #opendata
Hoy he estado en las II Jornadas sobre Reutilización de la Información del Sector Público celebradas en Madrid (hoy en la Universidad Complutense, y mañana en la Carlos III).
Quería compartir con vosotros mis impresiones sobre el día de hoy, en las distintas ponencias que se han realizado durante la jornada.

Revisión de la Directiva Europea 2003/98 sobre Reutilización de la Información del Sector Público - Juan Pelegrín (Comisión Europea)
Inspiradora charla de Juan Pelegrín de la Comisión Europea, a quien ya tuve el placer de escuchar en el último encuentro Aporta. Primero ha realizado una introducción sobre la improtancia de la apertura de datos, y luego ha hablado en profundidad sobre la estrategia en materia de Open Data de la Comisión Europea.
¿Por qué es importante la apertura de datos? Algunos de los motivos:
  • El mercado de Open Data tiene un potencial de 27.000.000.000 € (veintisiete mil millones de euros).
  • La apertura de datos aumenta transparencia y participación ciudadana, así como eficiencia administrativa y la rendición de cuentas.
  • Aportación del Open Data a la ciencia
  • Importancia de un verdadero mercado único de datos abiertos (a todos los niveles: reginal, local, etc.)
Estrategia Open Data de la Comisión Europea (pulicada en diciembre):
  • Revisión de la directiva ISP:
    • Se han realizado tres estudios sobre PSI:
      • Mercado e Impacto de la reutilización (G.Vickery)
      • Cuáles son los problemas de los productores de información para abrir sus contenidos (Curtis+Cartwright)
      • Estudio de los modelos de priccing de PSI (Deloitte).
    • Cambios en la directiva:
      • Todos los datos públicos por defecto son reutilizables, a no ser que estén cubiertos por alguna de las excepciones.
      • Extensión del ámbito de aplicación a bibliotecas, museos y archivos
      • Obligación de definir la misión del organismo.
      • Se requiere una supervisión independiente
      • Obligación (si es posible) a publicar los documentos en formatos reutilizables.
      • Modificación de las reglas de precios
    • La revisión de la directiva está actualmente en proceso de discusión y aprobación (saldrá adelante en un plazo de entre uno y dos años).
  • Revisión de la Decisión de la Comisión sobre reutilización (predicar con el ejemplo):
    • La información de la comisión es libre, abierta y reutilizable sin restricciones
    • Organizar los datos para que sean legibles por una máquina
  • Fomentar I+D+I en datos abiertos. Entre otras medidas, lanzamiento de un piloto del portal de datos de la Comisión Europea en el segundo trimestre de 2012.
  • Fomentar intercambio de información entre países miembros, coordinar las medidas entre estados miembros. Entre otros, el grupo PSI, ePSIPlatform y LAPSI.
Marco legal en España: Real Decreto 1495/2011 - Jorge Cancio (SETSI - Proyecto Aporta)
Ponencia de Jorge Cancio sobre los avances en materia de Open Data del proyecto Aporta durante el año pasado (están haciendo una gran labor en materia de reutilización, Jorge también participó en último encuentro Aporta.).
Ha comentado que había preocupación por lo que significaba realmente "información", y por eso en el Real Decreto se deja claro que "Información" incluye también "Datos Agregados", es decir los datos en bruto.
La ley 37/2007 deja abiertas muchas posibilidades/opciones:
  • No existe obligación a la Administración para autorizar la reutilización
  • Las Administraciones pueden elegir su modelo de puesta a disposición de la información
  • Cada Administración puede elegir si desea cobrar tasas por la puesta a disposición de la información
Se ha mostrado un mapa sobre la apuesta RISP en las Administraciones Autonómicas de España. Lamentablement la Comunidad de Madrid sigue sin tener una iniciativa Open Data clara ni un portal de Datos Abiertos :-(
El año pasado el proyecto APORTA hizo un estudio sobre el mercado de la reutilización en España, realizando un censo de unas 250 empresas que tienen actividades de reutilización.
Algunos contenidos del RD 1495/2011:
  • Autorización general de reutilización: toda la información no sometida a ningún tipo de restricción especial es reutilizable.
  • Obligación de las AAPP de comunicar cuál es la información disponible.
  • Definir la figura del responsabe dentro de las AAPP
  • Reutilización permitida sin restricciones, siguiendo el espíritu de las licencias Creative Commons (otras condiciones requieren un procedimiento especial).
  • Cesión no exclusiva de derechos de propiedad intelectual
  • Las tasas y precios están fuera del marco del Real Decreto
  • Da soporte legal al catálogo de información pública de datos.gob.es (obligación de mantener actualizado el catálogo, etc.)
Hay una guía bastante avanzada de aplicación del Real Decreto, indicando a los organismos cómo pueden hacer las cosas para cumplir el RD. También hay una norma técnica de interoperatibilidad.

Usos potenciales (y reales) de los mapas, directorios y otros productos informativos de la información pública - Luis Collado (Google España)
Buena frase de comienzo de Luis Collado, bajando a todos a la cruda realidad: "Ya hemos escuchado el telediario, ahora vamos a ver las noticias reales". Hay mucho camino todavía por andar en materia de RISP.
En el mundo hay 2.200 millones de usuarios de internet. El crecimiento supera la velocidad del desarrollo normativo, va muy por delante de la ley y la normalización. El consumo de información por Internet está a punto de superar al consumo por el medio hasta ahora por excelencia, la Televisión.
Los ciudadanos (los usuarios) ahora tienen el Poder de elegir la fuente de información, el ciudadano quiere participar, opinar, compartir, etc. El papel ha cambiado, ya no es un papel pasivo, el ciudadano tiene el control.
La clave de este nuevo escenario es el usuario/ciudadano/consumidor de información.
Pasos a dar por la Administración (cosas que no ocurren a día de hoy, salvo el primer nivel):
  • Hay muchos organismos públicos que con tener presencia en internet (crear un portal) se conforman: Hemos puesto los datos que tenemos en nuestra web.
  • El siguiente paso es maximizar la visibilidad, hacerse ver. Hay que dar visibilidad a los datos a los potenciales usuarios.
  • Hay que innovar, el sector público debería tener capacidad de innovación.
  • Trabajar la usabilidad, proporcionar una experiencia agradable al usuario. Las cosas en internet deberían de ser mucho más amigables.
  • Medir el grado de utilidad que se está dando a los ciudadanos, el grado de satisfacción.
Surge la figura de los infomediarios o facilitadores, terceros que acercan al ciudadano con los proveedores de información públicos. El papel de estos no está definido en la normativa.
Formas de uso de la información pública, y barreras que han encontrado:
  • Libros (google books): Algunos directores de bibliotecas le han dicho "El libro es mío y el que quiera verlo que venga, no lo voy a publicar en Internet".
  • Mapas (google maps): Mezclan gran cantidad de información de distintos orígenes, muchas veces las administraciones no han aportado la información que tenían para poder facilitarlo.
  • Arte (google art project): Algunos directores de museos nacionales han dicho "Quien quiera ver el cuadro que venga aquí, no voy a ponerlo en Internet".
  • Información en tiempo real de la situación del tráfico: Muchos ayuntamientos ya tienen este servicio en sus webs, pero "el que la quiera utilizar que venga a mi sitio".
  • Información en tiempo real de POIs (Puntos de Interés), negocios, etc.
Temas para el debate / análisis:
  • Concepto de Propiedad vs Derecho de Uso. ¿De quién es la propiedad de la información del sector público? Los ciudadanos con sus impuestos pagan a los organismos públicos que la producen.
  • Propiedad Intelectual de los Contenidos (no regulada)
  • Definir cuál es el papel de los Terceros (infomediarios): ¿Explotación comercial? ¿ROIs adicionales?
  • Tipos de Licencia: Ahora mismo cada organismo lo decide, debería estar regulado.
  • Re-re-re-re... utilización.
  • Precios. Hay organismos que cobran, otros que no, ...
  • Papel de los terceros cuando pueden ser sustitutos de los servicios públicos (Ej: El catastro sustituido por la información cartográfica de Google). ¿Dónde está la barrera? ¿Puede un servicio privado sustituir al original servicio público?
Datos Enlazados en la Biblioteca Nacional – Daniel Vila-Suero (UPM)
Me ha gustado esta charla porque tenía algo más de contenido técnico, que es donde me siento más cómodo :-) Daniel ha participado en el análisis, diseño y desarrollo del proyecto de datos enlazados de la Biblioteca Nacional (disponibles los datos enlazados de la Biblioteca Nacional a través de la URL: http://datos.bne.es).
Primero ha hecho una introducción a los datos enlazados:
  •  Ej: Alguien quiere saber quién ha traducido “El Quijote” a otros idiomas. Tenemos varias fuentes de datos (varias bibliotecas) en distintos formatos.
  •  El objetivo es tener los datos “enlazados” para poder navegar entre los datos de diversas fuentes de datos. Así se facilita la combinación de datos de fuentes heterogéneas
  • Para ello se exponen los datos de la Biblioteca Nacional en la web utilizando estándares (Semantic Web, RDF, etc.)
Luego ha detallado el proceso que han seguido para la transformación y estandarización de los datos a formatos tratables automáticamente:
  • Se describe en RDF (un lenguaje) las entidades y sus relaciones (Ej: Persona, Obra). Esto se llama el modelo u ontología.
  • Luego se definen los datos: las instancias de cada entidad (Ej: “El Quijote” y “Cervantes”).
  • Se asignan identificadores únicos (URIs) a cada instancia, así como a las entidades.
  • Se generan relaciones de equivalencia para enlazar con otras fuentes de datos (Ej: La URI de Cervantes en la Biblioteca Nacional se corresponde con esta otra URI de Cervantes en la Biblioteca Alemana).
Por último, ha comentado las fases del proceso para publicar datos enlazados en la Administración Pública, que son similares a los propuestos por una futura norma en trámite:
1)      Especificación: Cuáles son los datos de origen. Esquema de metadatos.
2)      Modelado: Buscar el modelo conceptual (ellos siguieron los vocabularios de IFLA).
3)      Generación de RDF: Desarrollar la infraestructura tecnológica para mostrar toda la información en formato RDF. Enlaces entre las instancias. Ej: Miguel de Cervantes es creador de “La Galatea”.
4)      Generación de Enlaces:  Enlaces a otras fuentes de datos externas del dominio bibliotecario (enlaces de equivalencia).
5)      Publicación: Publicación en web según estándares.
6)      Explotación: Explotación por dos partes:
a.       Consultas al repositorio RDF
b.      Interfaz web
Resultados: más de 58 millones de tripletas de RDF generadas durante el proceso de datos enlazados de la biblioteca nacional.

El modelo francés de Reutilización de la Información del Sector Público – Denis Berthault (GFII)
Muy amena la charla de este francés que con tonos irónicos ha dicho verdades como puños sobre la historia y el estado actual del Open Data en Francia.
Sobre la historia de la reutilización de la información del sector público en Francia:
  • En los 90, las administraciones públicas vendían PSI a altos precios (datos estadísticos, legales, etc.).
  • En 2005 se implementó la directiva muy ligeramente, pero cambió poco (los precios seguían siendo altos).
  • En 2008 se dio la importancia que requiere al Open Data, como decisión política. Algunos organismos comenzaron a abrir los datos, pero no demasiados.
  • En 2010 se creó un comité (COEPIA) para proporcionar guías a las administraciones sobre cómo abrir sus datos.
  • 2011: el Big Bang del Open Data:
o   En diciembre de 2011 se publica http://data.gouv.fr, con 300.000 data sets (más o menos igual que el Reino Unido).
o   Datos gratis por defecto: si las administraciones quieren cobrar por los datos, tienen que justificarlo debidamente.
Luego ha hablado sobre cambios que están por venir a partir del 2012, y cuestiones a plantearse para el futuro:
  • ¿Cuál va a ser el impacto de la crisis en la iniciativa Open Data?
  • ¿Cobrar por los datos? Hay discusiones internas entre el Ministros de Economía y Finanzas  (que uiere cobrar por los datos) y el Primer Ministro (que quiere que se distribuyan gratuitamente).
  • ¿Cómo evaluar el impacto real de PSI? Hay muchas ganancias indirectas muy difíciles de medir.
  • ¿Calidad de los datos públicos?: No usar formatos propietarios (Word, Excel, PDF, …). Hay que trabajar en la parte técnica de los datos, su calidad y reusabilidad.
  • ¿Qué licencia utilizar? Creative Commons, APIE, Etalab, etc.
  •  Temas legales: Copyrights, derechos de autor, privacidad (anonimizar) , confidencialidad, etc.
  • ¿Qué pasa con los datos Culturales (museos, bibliotecas, etc.)? En Francia esto deben tratarlo aparte, hay presiones por muchas partes.
  • ¿Cómo obtendrá revenue/ROI el Gobierno a medio/largo plazo de la PSI? -> Importante para el Ministro de Finanzas, recuperación de la inversión.
  • Políticas de precios: ¿Pagar un % del revenue obtenido por el reutilizador?
  • ¿El contenido necesario que debería ser gratis? En Francia tienen identificadores únicos de compañías, puntos geográficos, etc.  Consideran que hay que cobrar por esta información.
  •  Datos personales y Anonimización.
  • Derechos de Autor de los agentes públicos
  • La Administración piensa que no es su tarea publicar/abrir los datos.
  • Control de los reutilizadores/infomediarios.
Por último ha hablado sobre las necesidades de los reutilizadores (él representa a varias organizaciones privadas de infomediarios):
  •      El mismo contrato de licencia para todos los reutilizadores
  •           Una política de precios transparente que explique de dónde vienen los precios, y avise con bastante antelación si van a cambiar.
  •           Establecer convenios de colaboración entre Administración y reutilizadores.
  •           No PDF
  •           Calidad y estabilidad de los datos
  •           Creación de Portales agregadores de catálogos de datos, con metadatos de estos.
  •           ¿Un único punto de venta/distribución de los datos?
  •           ¿Está la administración preparada para auditar a los reutilizadores?
  •           Algunos datos nacionales como los identificadores únicos tienen que ser gratuitos
El proyecto ePSIPlatform en sus últimos desarrollos – Marc de Vries (ePSIPlatform)
Marc ha hablado sobre la historia de la reutilización de datos del sector público, desde el primer GreenPaper de 1998.
Luego ha hecho mención a varios estudios de Impacto de PSI en Europa:
  •           2006: MEPSIR: 27.000 millones de €
  •           2008: Varios estudios: 28.000 millones de euros
  •           2011: Vickery study: Efectos económicos directos: 32.000 millones de €, a los que añadir efectos indirectos.
  •           2011: POPSIS: Hay mucha más reutilización, uso y beneficios en impuestos cobrados a largo plazo si no se cobra por los datos (o se cobran precios mínimos).
Después ha hecho una reflexión muy interesante sobre dónde poner el corte entre la Administración y el resto en la cadena de valor de la PSI. Partes de la cadena de valor:
  •           Producir la información
  •           Recolectar y compilar
  •           Distribuir
  •           Reutilizar
Ha mostrado cómo ha evolucionado la cadena de valor desde 1998 hasta la actualidad en tres mercados de datos: Legales, Topográficos/Tráfico y Meteorológicos.
Por último ha hecho un poco de publicidad sobre una conferencia organizada por la ePSIPlatform en Rotterdam el 16 de Marzo.

Impactos de la RISP (y del OpenData) sobre la gestión de la documentaicón y archivo de las Administraciones Públicas – Enric Staromiejski (Everis)
No sé si es porque era después de comer y me ha pillado un poco dormido, pero la verdad es que para venir del mundo técnico la charla de Enric me ha parecido bastante aburrida. Además ha venido con una presentación en inglés reutilizada de otra charla, a la que ni siquiera se había molestado en eliminar las transparencias que no venían a cuento.
Durante su charla se ha dedicado a vender a Everis y su experiencia en áreas relacionadas directamente con la gestión de la información:

  •          Interoperabilidad
  •          Gestión de Documentación y Registro
  •          Reutilización de la Información del Sector Público
Ha profundizado en el desarrollo del Proyecto SIGEDA: Sistema de Gestión Electrónica de la Documentación de la Administración de la Generalitat, cuyo objetivo es implementar medidas para una gestión horizontal de la documentación de la Generalitat.
Ha mencionado una idea interesante: entre los agentes implicados (muy heterogéneos), se identificó la necesidad de una oficina de gestión de la información del sector público (MOPSI), pero no se ha llevado a cabo. Creo que esto es un punto clave para llevar a cabo un proyecto de esta envergadura.

P.D: Mañana no estaré en el segundo día de las jornadas, así que no podré contaros de qué se ha hablado (si alguno de los asistentes se anima, adelante!).




3 comentarios:

Alorza dijo...

Lástima que no estés el segundo día: has hecho un resumen muy útil. Gracias por compartir.

Manuel Pereira dijo...

Alberto me alegro de que te haya resultado útil. Intento en la medida de lo posible aportar mi granito de arena para divulgar la RISP.
Sigo muy de cerca vuestro trabajo... y me dais mucha envidia! Me pregunto si algún día tendremos una iniciativa Open Data en la Comunidad de Madrid. I hope so ;-)

Antonio Ibáñez dijo...

Muchas gracias por el resumen!