Seleccionar página

Hace unos días llegué a una entrada del blog de la IDEE española sobre los sitios más descargados del Portal de la Administración Electrónica (PAE) (http://blog-idee.blogspot.com/2018/05/que-datos-abiertos-se-descargan-mas.html), que presentaba como más descargados los datos de Paro registrado por municipiosEste link me llevó a un excelente mapa del paro por municipios, provincias, comunidades, regiones de la UR y países de la UE, pero con datos de 2016. Por los comentarios parece que su autor no dispone de tiempo para los trabajos de actualización, una pena.  La única pega que le puedo poner a ese sitio es que sus mapas no están publicados como servicios OGC por lo que sólo se pueden ver en su web.

Dándole vueltas al tema he pensado hacer algo en http://urbiThings.com que supla esta carencia, no quedará tan molón como el del mapadelparo.com pero creo que será útil. Mi primer intento es el mapa http://urbithings.com/493c36e1-71ad-4900-ae89-dced8825adbe.ms que presenta los datos de paro de diciembre de 2018 por municipios (los últimos publicados por el INE).

Asi que tan pichi me fuí al INE a buscar la tasa de paro por municipios de 2018, pero… no existe. La tasa de paro el INE no la publica por municipios, solo hasta provincias. Bueno, tendremos que calcularla o buscar otra fuente.  En la web de Expansión hay una página del desempleo en España https://datosmacro.expansion.com/paro/espana?sc=LAB- que presenta la evolución anual e interanual, también un excelente trabajo, esta vez sin mapas y sin posibilidad de descargar sus datos. No he visto mas fuentes de datos disponibles (aunque tampoco me he empeñado a fondo).

Abocado a tener que calcular la tasa, la Economipedia indica en su página https://economipedia.com/definiciones/tasa-de-desempleo-paro.html que la tasa de desempleo será  (número de desempleados/población activa)*100. Sencillo, solo hay que buscar ambos datos y calcularla.

Para el dato de desempleados, el portal de datos abiertos de España nos proporciona los del segundo semestre de 2018:  https://datos.gob.es/es/catalogo/e00142804-paro-registrado-por-municipios, permite descargar una hoja Excel que contiene una fila por mes para cada uno de los municipios, con su codigo INE, el dato de paro total y desglosado por sexo, edad y sector de actividad. Un lujo de tabla, parece que la hacen semestral, así que habrá que volver hacia el 16 de julio para ver el primer semestre de 2019  (me lo apunto). Quitamos todas las filas que sobran ya que solo nos interesa el mes de diciembre y todas las columnas que sobran ya que solo vamos a mapificar el dato total. 

Ahora hay que buscar los datos de población activa. En este caso el portal de datos abiertos no nos ha servido tan bien como antes, o yo no he sabido encontrar el dato. En todo caso he vuelto al INE a bucear en su INEbase buscando datos de población activa. Así, directamente  por «población activa por municipio» no lo hay. Pero en el apartado de «Demografía y Población», dentro de «Padrón. Población por municipios» dentro de «Estadística del Padrón continuo» y en «Principales series de población desde 1998» (http://www.ine.es/jaxi/Tabla.htm?path=/t20/e245/p08/l0/&file=02002.px) es posible acceder a un formulario de consulta para seleccionar Comunidades (seleccionar todas), el grupo quinquenal (seleccionar los activos desde 15 a 64 años), la nacionalidad (¿seleccionar Total o solo Españoles?, yo he seleccionado Total), el sexo (seleccionar ambos sexos) y el año (en este caso 2018).

Al ejecutar la consulta nos devuelve un fichero con extensión .px. No desesperarse, es un fichero PC.Axis (un invento sueco), una pequeña base de datos que se consulta descargando del INE la aplicación PC-Axis (https://www.ine.es/ss/Satellite?L=es_ES&c=Page&cid=1254735116596&p=1254735116596&pagename=ProductosYServicios%2FPYSLayout) e instalándola en el PC. Una vez instalada nos permite seleccionar los municipios (seleccionar todos) y los grupos de edad, al ejecutar la consulta genera una tabla de datos que es posible guardar en formato Excel. Tiene el pequeño inconveniente de que junta el codigo INE y el nombre del municipio en un solo campo, así que hay que hacer ahí un pequeño trabajo para sacar los codigos INE (=izquierda(a2;5) en una columna separada y  sumar los grupos de edad «activos» para obtener la población activa por municipio. 

Tras este trabajillo de minería de datos ya tenemos los dos datos de partida, solo queda juntarlos entre sí y luego añadirles la geometría municipal. Juntarlos debería ser sencillo ya que en ambas tablas está el codigo INE. Yo lo he hecho pegando la tabla de población activa dentro de una hoja nueva en la tabla de desempleados, añado a la hoja de desempleados una columna con el dato de poblacion activa y una fórmula para buscar ese dato en la hoja de población, algo así como («=INDIRECTO(DIRECCION(COINCIDIR(G2;’pob activa’!$B$2:$B$8125;0)+1;3;;;»pob activa»))») donde G2 es la columna del codigo INE de la hoja de desempleo y pob activa’!$B$2:$B$8125 es la columna de codigos INE de la hoja de población activa. Antes hay que tener la precaución de que en ambas tablas el código INE sea un campo de texto de cinco posiciones con ceros. En la hoja de desempleo el codigo INE  nos llega como números, unos de cuatro y otros de cinco posiciones, para normalizarlos yo lo sustituyo poniendo ceros donde faltan con la formulilla (=izquierda(«00000»;5-largo(g2))&g2) de forma que en ambas tablas el codigo INE tenga el mismo formato.

Con todos los datos juntos solo queda crear una columna con la tasa de desempleo utilizando la fórmula indicada al principio.

Para añadir la geometría hay varias opciones, se puede utilizar ArcGis y sus funciones para unir una geometría de municipios (el mismo INE en la página del PC.Axis proporciona la descarga en formato SHP de los municipios, provincias y comunidades de España) con la hoja de datos de desempleo. El problema es que hay que comprar ArcGis. Se puede utilizar qGis, que es gratuito, utilizando el componente «Unir atributos por valor de campo». Seguramente también se puede utilizar svGIS aunque yo no le he probado.

En nuestro caso he utilizado urbiThings. Como fuente de datos de geometría se puede utilizar el SHP del INE «esp_muni_00.shp» antes mencionado o bien bajar de urbiThings un Conjunto de Datos denominado «Base de Municipios de España con CodigoINE», se puede localizar en la pestaña de «Elementos» del Buscador y utilizar la opción de «Descargar Fichero».

Una vez dispongamos de un SHP que tenga una columna con codigo INE normalizado (recordad de cinco posiciones con ceros) se sube a urbiThings como Conjunto de Datos  utilizando la función «Importar Conjunto de datos»:

urbiThings nos pedirá el Tema estándar (el tema al que se refiere el conjunto de datos) y el territorio donde se ubica, dos datos que luego son importantes para encontrarlo. También podremos asignarle el nombre que se estime conveniente. Yo suelo utilizar un nombre que incluya el tema concreto, la fecha y la fuente.

Una vez creado en urbiThings nos podrá servir de base de geometría municipal para cualquier otro Conjunto que tengamos ahora o en el futuro (mientras no haya cambios en la estructura administrativa de España). Por ahora lo usaremos para combinarlo con nuestra hoja Excel utilizando la opción «Combinar con Excel» para crear un Conjunto nuevo que tendrá las geometrías del Conjunto de base y las columnas de la hoja de desempleo:

urbiThings nos pedirá el nombre del nuevo conjunto, el fichero Excel a combinar, el campo del Conjunto base con el codigo INE, el campo de la hoja Excel con el código INE, el Tema y Territorio al que corresponde el nuevo Conjunto. Al pulsar «Guardar», urbiThings realiza la combinación y crea el nuevo Conjunto. En nuestro caso yo lo he llamado «Paro en España a diciembre de 2018 (fuente INE)». 

Para urbiThings ese nuevo Conjunto es una fuente de datos, su contenido se puede ver o editar con las opciones de «Editar Propiedades, Datos o Geometría», que nos ayudarían a pulir algún dato si fuese necesario. Pero para publicarlo como un Mapa es preciso utilizar la opción de «Generar Servicio de Mapa». Con ella crearemos un servicio OGC WMS que representa el contenido del Conjunto de Datos con una determinada simbología. Por tanto podemos crear tantos Servicios de Mapa como sea preciso utilizando como fuente el mismo Conjunto de Datos. Para mi caso yo he creado el Mapa utilizado el método «Graduado» partiendo la tasa de desempleo en cinco clases de la misma forma que hace el mapadelparo.com:

Una vez guardado, el nuevo Mapa será inmediatamente visible en el Buscador de Mapas (mientras se le haya asignado una licencia que lo permita) para todo el mundo:

Como servicio OGC es accesible desde cualquier sistema que los admita, en la imagen siguiente se observa este mismo mapa sobre QGis. 

La URL del servicio es directamente accesible al editar la propiedades del Servicio de Mapa en urbiThings. 

Desde urbiThings intentaremos publicar y mantener al día aquéllos datos sobre España que tengan más interés, dada la sencillez y facilidad con que se pueden extraer y manejar (aunque a veces sean precisos unos pocos trucos de minería de datos).

Ignacio Arnaiz Eguren

Director de Arnaiz Urbimática SL