La información medioambiental en España: recursos y acceso a la información publica: análisis webmetrico (2a parte). - Vol. 37 Núm. 1, Enero - Enero 2014 - Revista Interamericana de Bibliotecologia - Libros y Revistas - VLEX 637533781

La información medioambiental en España: recursos y acceso a la información publica: análisis webmetrico (2a parte).

AutorBlázquez Ochando, Manuel
CargoEnsayo

Environmental Information in Spain: Resources and Access to the Public Information. Webometric Analysis (Part 2)

  1. Introducción y objetivos

    El acceso a la información pública depende de las polÃÂticas de información y documentación y también de la estructuración y diseño de los medios informativos y divulgativos puestos a disposición en la red que, por ende, requieren de un estudio webmétrico profundo para la cuantificación y análisis cualitativo de las meta-etiquetas y metadatos Dublin Core. En consecuencia, en esta segunda parte de la investigación relativa a los recursos y al acceso de la información pública medioambiental, el objetivo principal del estudio es el análisis del estado del arte en relación a la web pública española especializada en materia de Medio Ambiente con la intención de establecer, a posteriori, una comparación con la web pública mexicana en materia medioambiental. Para el presente análisis--una vez que se ha definido y delimitado el alcance de la información ambiental a partir de la normativa nacional e internacional comentada en el artÃÂculo anterior y conociendo la complejidad de la gestión de este tipo de información--, se ha requerido la utilización de la herramienta webcrawler Mbot (Blázquez Ochando, 2013a). Esta herramienta ha sido desarrollada para analizar la web a partir de dos listas de enlaces que representan las principales páginas web relativas al sector medioambiental y que son soportadas por la administración española y mexicana, utilizadas como objeto del estudio. Debido a la extensión de los resultados obtenidos en esta investigación, en el presente artÃÂculo se relacionan los datos referidos a la web medioambiental de la administración central española y se plantean los siguientes objetivos especÃÂficos:

    * Identificar y analizar los enlaces de la administración central española en cada uno de los niveles de análisis establecidos a partir de la muestra de dominios seleccionada.

    * Identificar los formatos que más utiliza la administración central española para disponer la información pública medioambiental en la red.

    * Estudiar el ratio por página web y el tipo de meta-etiquetas y metadatos utilizados por la administración central española.

  2. MetodologÃÂa

    El análisis de la web requiere el empleo de programas de análisis y rastreo denominados también Web-crawlers. Estas aplicaciones analizan la web mediante un método bien definido: en primer lugar, emplean una lista de enlaces (constituida por dominios, sitios y páginas web), a la que se denominada semilla. A continuación, se extraen y analizan los contenidos de cada enlace para obtener nuevos enlaces a terceras páginas dependientes del mismo dominio o sitio web, alcanzando de esta manera distintos niveles de profundidad (Thelwall, 2001, p. 323). Posteriormente, toda la información es almacenada de forma sistemática en una base de datos (tabulada y computada) para generar los distintos informes que se ofrecen en esta investigación (Blázquez Ochando, 2013b).

    El primer paso metodológico del estudio consistió en la confección de una semilla (Cothey, 2004, p.1230) especializada en Medio Ambiente y sectores afines, tales como la energÃÂa, el cambio climático, la oceanografÃÂa, geologÃÂa, geografÃÂa, minerÃÂa, agricultura, biodiversidad e hidrografÃÂa. También se incluyen en esta lista los centros de investigación y ministerios que están relacionados directa o indirectamente con la temática principal estudiada, véase Tabla 1 en la que se presenta una agrupación de los organismos, de acuerdo a su adscripción pública, realizada en septiembre de 2013.

    En la semilla especificada se observa la presencia de dos ministerios, seis confederaciones hidrográficas, siete institutos públicos de temáticas afines y siete entidades directamente relacionadas con el estudio, gestión y tratamiento del sector energético español. La selección permite reflejar una gran parte del sector medioambiental de la Administración Central española. No obstante, se debe reseñar un hecho importante, que es la naturaleza y tamaño de los sitios web de los ministerios y agencias estatales con respecto al resto de instituciones y el criterio de selección. Por ejemplo, el BoletÃÂn Oficial del Estado (BOE) y el Instituto Nacional de EstadÃÂstica (INE) han sido seleccionados por contener, respectivamente, información legal y estadÃÂstica relativa a la materia medioambiental. Añadido a este factor, comparten una importante jerarquÃÂa de niveles de enlazamiento junto con los Ministerios, requiriendo, por tanto, un análisis en mayor profundidad dada su densidad de contenidos, ya que pueden seguirse encontrando páginas web en el 6 y 7 nivel de análisis. Debido a tales circunstancias y con el objetivo de uniformar la investigación, se ha tenido en cuenta en la configuración del webcrawler que el análisis se efectuará a tres niveles, o lo que es lo mismo, un nivel por cada página enlazada desde el enlace o dominio raÃÂz especificado en la semilla, tal como describen en sus contribuciones (Chakrabarti; Joshi; Punera; Pennock, 2002, p.509) (Bergmark; Lagoze; Sbityakov, 2002, pp.91-106). Esta decisión ha sido tomada con el objetivo de reducir el tiempo de rastreo del webcrawler y obtener una base de conocimiento o muestra suficiente como para observar unos patrones claros durante el análisis de los datos resultantes.

    El siguiente paso para el análisis de la semilla es la configuración del rastreo en el webcrawler. En este sentido, se estableció la extracción de metadatos, meta-etiquetas, canales de sindicación, imágenes, documentos, archivos multimedia, correos electrónicos y texto completo (Blázquez Ochando, 2011, p.2-3). De todos los elementos analizados, el estudio aborda con especial interés los términos y textos empleados en los metadatos y meta-etiquetas, ya que son empleados de forma directa en la indexación de las páginas web por parte de los principales buscadores (Berners Lee, 1995. p.22-23). Dicho de otra forma, el éxito en la recuperación de un contenido, con independencia de su temática, estriba en gran medida en su meta-descripción e identificación mediante metadatos y meta-etiquetas apropiados. Las meta-etiquetas son etiquetas html introducidas en el encabezado de las páginas web que describen, según las especificaciones oficiales (W3C, 1999), el tÃÂtulo, autor, derechos, palabras clave y descripción del sitio web; es decir, campos de descripción mÃÂnimos para la identificación del sitio web. Por otra parte, los metadatos Dublin Core cualifican con 54 elementos (DCMI, 2012) aspectos más variados y útiles desde el punto de vista documental como, por ejemplo: resumen, derechos de acceso, recursos web alternativos, público objetivo, cita bibliográfica, colaborador, cobertura, fecha de creación del recurso, fecha de aceptación, fecha de copyright, fecha de envÃÂo, extensión, formato, partes del recurso, versiones del recurso, identificador normalizado, referenciación de terceros, idioma, licencia, soporte, procedencia, editor, relación con terceros recursos, fuente de información original, sumario de contenidos o tipo de contenido, entre otros. Junto a los elementos sujetos al análisis, también se establecen restricciones de análisis de dominio que tienen como objetivo el análisis pormenorizado de los dominios especificados en la semilla, bloqueando el análisis de páginas externas con un dominio diferente. De esta manera, se permite enfocar el análisis sólo a los enlaces especificados, obteniendo una mayor precisión en los resultados asàcomo un menor tiempo de ejecución.

  3. Resultados

    Con la intención de que los resultados obtenidos en la presente investigación académica tengan una mejor comprensión, estos han sido divididos en tres grandes subepÃÂgrafes: enlaces, formatos y, por último, meta-etiquetas y metadatos.

    3.1. Enlaces

    La ejecución del análisis dio como resultados más de 1,5 millones de enlaces, de los cuales 679.000 son únicos y sin repetición (Henzinger, 2003) (1), véase Tabla 2. Este dato indica que más de 843.000 enlaces son empleados para la redirección y navegación de contenidos en los distintos sitios web analizados, puesto que ocupan los lugares comunes de los menús generales y contextuales, lo que supone el 55,38% del total. Esto significa que existe una gran interconexión de contenidos.

    En cuanto al recuento de enlaces para cada nivel de análisis, se observa una progresión exponencial tanto en las cifras de enlaces obtenidos como de enlaces únicos, especialmente entre el nivel 2 y 3, donde se observa que de 37.177 enlaces únicos se alcanzan los 649.736, véase Tabla 3 y Figura 1 en la que se muestra la lÃÂnea exponencial que describe la tendencia.

    En cuanto a la topografÃÂa de la web, se observa que los dominios genéricos más reiterados son los españoles ".es", superando los 675.000 enlaces únicos y los gubernamentales en lengua española ".gob.es" con 4.724, véase Tabla 4 (2). Con cifras comprendidas entre los 500 y los 1.200 enlaces únicos se encuentran los dominios de organizaciones y comerciales "org", ".com".

    Si bien las cifras mencionadas son elevadas y representativas de los resultados obtenidos, resulta muy significativo profundizar en los datos recopilados sobre enlaces salientes con dominio "eu" de forma que pueda ponerse de relieve la relación que existe entre la web de la administración central española de medio ambiente con respecto a la Unión Europea. Los resultados obtenidos demuestran que el portal de...

Para continuar leyendo

Solicita tu prueba

VLEX utiliza cookies de inicio de sesión para aportarte una mejor experiencia de navegación. Si haces click en 'Aceptar' o continúas navegando por esta web consideramos que aceptas nuestra política de cookies. ACEPTAR