Una evolución de la web semántica para una mejor reutilización de la información del sector público

Una evolución de la web semántica para una mejor reutilización de la información del sector público

La evolución de Internet hacia la Web Semántica se basa en una adición formal de metadatos semánticos y ontológicos, para describir el contenido, el significado y la relación existente entre los datos, de modo que esta información también puedan ser interpretada automáticamente por medio de aplicaciones informáticas. En esta línea de trabajo se enmarca el desarrollo del vocabulario del Catálogo de Datos (DCAT) por parte del Consorcio de Internet (W3C), en cuya ontología destaca la definición de tres clases principales: (1) Dataset o activo que caracteriza a cada Conjunto de Datos, (2) Distribution o distribución de éstos, que incluye el URI (Uniform Resource Identifier) que posibilita acceder a ellos, bien sea  a través del sistema de archivos que contiene los datos, del servicio que los suministra, etc., y (3) Catalog o conjunto que incluye a todos los Datasets. Si bien el énfasis conceptual reside en estos últimos pues los catálogos no dejan de ser una solución ad hoc para representar que éstos deben encontrarse agrupados o contenidos en algún lugar.

Esta aproximación ad hoc no es única ni relacionada sólo con el movimiento Open Data sino que parece ser algo generalizado o al menos común a la que está siendo desarrollada en la plataforma Joinup dentro del marco del programa ISA de la Comisión Europea: RADion (cuyas clases principales son: Repository, Asset y Distribution) y los vocabularios desarrollados a partir de éste, como ADMS y su especialización para Software: ADMS.Sw. No siendo ésta la única simplificación o solución ad hoc adoptada en ellos o en DCAT pues, por ejemplo, en todos estos vocabularios tampoco se le da el tratamiento que requiere la gestión de la propiedad intelectual de la documentación asociada a cada Asset, dando la impresión de que todo lo que sea complementario a éstos se describe someramente y con la profundidad suficiente como para poder solventar las necesidades expresivas de aquéllos y de su correspondiente dominio específico.

Debido a las limitaciones que encontramos en esas aproximaciones a la hora de servir de base para ampliar su particular ámbito de actuación decidimos adoptar una más general a la vez que intentamos evitar la adopción de soluciones ad hoc para afrontar el desarrollo del Decreto 159/2012, de 24 de julio, por la que el Gobierno Vasco reguló la apertura y reutilización de las aplicaciones informáticas de sus Administraciones Públicas. Para evitar que nuestra solución fuera otro caso particular, más o menos complejo, decidimos abordar no sólo las necesidades resultantes del Decreto sino también las resultantes de la Reutilización de la Información del Sector Público (RISP), tanto de la que actualmente se considera como tal según el Real Decreto 1495/2011 de 24 de octubre, como de la que pueda serlo en un futuro, esto es, en cualquier tipo de información: datos, texto, código fuente de las aplicaciones, etc. En definitiva, consideramos las Open Apps y Open Data como sendos casos particulares de uno de los tres tipos de lo que han acabado siendo los Open Assets y el resultado de esta aproximación se plasmó en la Orden de 25 de Septiembre por la que la Consejera de Interior Justicia y Administración Pública aprobó la Política de Apertura y Reutilización de las Aplicaciones Informáticas que concreta cómo ha de estructurarse la información que debe publicarse en el Directorio de Aplicaciones de Fuentes Abiertas, que se crea según se regula en el citado Decreto, de modo que dicha información sea homogénea para todas las entidades incluidas en su ámbito de aplicación.

Desde el punto de vista semántico, la solución adoptada ha consistido en darnos cuenta de que sólo son dos, Asset y Distribution (ADion), las clases principales con las que se puede definir una ontología más general como la que se requiere para la Reutilización de la Información del Sector Público y que existen tres tipos de Assets: los Elementales (Datos Aplicaciones, Informes, etc.); los Contenedores (Catálogos que pueden contener Assets de un solo tipo de Asset Elemental o de un Proceso y Repositorios que sólo pueden contener Assets de tipo Contenedor; y los Procesos, concretamente los recién sistematizados Procesos de Reutilización, aunque la solución no está restringida sólo a éstos. Lo que conlleva una evolución de la actuales aproximaciones a la Web semántica que evita la especificación ad hoc de una tercera clase principal, por tratarse ésta de una restricción conceptualmente innecesaria una vez que se considera que los catálogos de DCAT o los repositorios de RADion también son Assets, y con ello no sólo se amplía el tipo de problemas que se soluciona sino que también se facilita la posible aportación de la computación social a la reutilización o a otros procesos similares.

A partir de ADion se puede derivar, como un caso particular cualquier ontología basada en la de DCAT o RADion. Del mismo modo que si, por ejemplo, se parte de cualquiera de estas ontologías y se hacen las correspondientes extensiones e hibridaciones de sus clases principales también se puede acabar recreando la de ADion. Aunque sea con las limitaciones conceptuales propias de una aproximación que va de lo particular a lo general en lugar de hacerlo, de forma más natural, yendo de lo más abstracto a lo más concreto. No obstante, ambas vías garantizan la viabilidad de una solución que posibilite la interoperabilidad entre ADion y DCAT o RADion. De ahí que para mantener la compatibilidad e interoperabilidad semántica entre los Open Assets, cuyo ámbito de aplicación es el de cualquier Reutilización de la Información del Sector Público, y los existentes catálogos de Open Data o los repositorios de Software, basados respectivamente en DCAT y ADMS.Sw, por ejemplo, también hemos establecido, con ayuda de las fundaciones CENATIC y CTIC, las correspondencias necesarias. Siendo además esta última fundación la responsable de su modelado en UML y su descripción en RDF. Así como Aldatic es quien se ha encargado de implementar la versión de Open Apps con la que se ya se da soporte práctico al citado Decreto.

También cabe destacar que en nuestra aproximación al modelado de la ontología para la RISP y en nuestro afán por obtener una solución tan abstracta y general como fuera posible, no sólo existen dos clases principales (ADion) sino que además los tres tipos de Asset tienen una parte común. De modo que ésta es justo la necesaria para describir los de tipo Contenedor, mientras que por medio de una extensión de ella se describe la de los de tipo Elemental y por medio de otra la de los de tipo Proceso. Produciéndose así una homogeneidad que facilita la explotación de los resultados por parte de un usuario final que tenga que manejar en un mismo entorno los tres tipos de Asset, como era nuestro caso.

Si bien cada Asset de tipo Elemental y Contenedor tiene al menos una Distribution, los de tipo Proceso se alejan un poco más de los modelos semánticos considerados hasta ahora pues tienen más de una, mantienen relaciones con los de tipo Elemental y Contenedor, y, lo que es más destacado, el acceso o la disponibilidad de algunas de las propiedades de su contenido es dinámica pues depende del estado en el que se encuentre el registro de su correspondiente implementación en cada momento.

Finalmente, cabe añadir que dada la generalidad que ha sido necesario tener en cuenta para abordar los tres niveles de abstracción que requiere la RISP es más que probable que las posibilidades que ofrecen estos tres tipos de Assets permita su aplicación a sectores y dominios ahora insospechados que, en cualquier caso, contribuyen a aumentar las ya de por sí amplias posibilidades que ofrece la Web semántica.

About Author

Comments

  1. Izaskun
    Izaskun 4 abril, 2013, 13:13

    Enhorabuena, me parece un gran articulo; pero sobretodo me gusta la propuesta de buenas soluciones pensando en las cosas bien hechas y en el futuro.

    Ahora bien, quisiera saber cúal es la situación actual: ¿existe alguna ontología, servicio web semántico o algo al que actualmente se puedan hacer consultas? algo en abierto a desarrolladores? Y me refiero a algún tipo de servicio abierto a desarrolladores que nos permita acceder a toda la información que GV ya tiene informatizada y sobre esos datos trabajar puediendo dar valor añadido a nuestros cliente.

    Muchas gracias,
    Izaskun

    Reply this comment

Write a Comment

Your e-mail address will not be published.
Required fields are marked*