viernes, 27 de marzo de 2009

Un nombre para cada día ...

El día 26 de octubre de 2005 decidí (no sé muy bien por qué ...) ponerle a cada día de trabajo un nombre. Desde ese día hasta ahora han pasado más o menos 717 días laborales. El otro día pensé que podría ser divertido ver qué palabras se repetían más en los nombres de los días. De ahí salió esta imagen:



Las palabras que más se repiten son las que aparecen más grandes. Curiosamente hay pocas palabras relacionadas con el trabajo concreto que desarrollo y muchas con el estado de ánimo, las ilusiones, frustraciones y demás aspectos personales. También se repiten mucho los lunes, jueves y viernes. El primer día de la semana, el último y el penúltimo (que está aquí por motivos distintos a los demás ...) quizás representan la ilusión por el inicio de la semana y por la llegada del fin de semana ...

La imagen se ha hecho con una elegante aplicación llamada wordle

jueves, 19 de marzo de 2009

Dejar las cosas sin hacer

Además del noble arte de dejar las cosas hechas, hay otro más noble: el de dejar las cosas inacabadas. La sabiduría de la vida consiste en la eliminación de lo no esencial ...

Li Yutang

miércoles, 4 de marzo de 2009

lunes, 2 de marzo de 2009

Edad de las repoblaciones forestales en Sierra Nevada II: Jugando con la incertidumbre

Partimos de una capa vectorial que muestra la edad de plantación de una serie de repoblaciones forestales en Sierra Nevada. Cada pinar tiene dos fechas probables de plantación, obtenidas mediante diversas fuentes de información. En esta entrada ensayaremos varios procedimientos para mejorar la representación gráfica de esta información. En concreto trabajaremos intentando incorporar la incertidumbre que hay asociada a cada fecha de plantación asignada a cada pinar.
Nos encontramos ante un caso particular de una situación bastante frecuente en el ámbito de la gestión del territorio: la información que utilizamos suele ser parcial, imprecisa, procedente de diversas fuentes y poco concreta en muchas ocasiones. Y con esa información es con la que se toman decisiones. Esto (entre otras cosas) hace que algunos autores consideren que la gestión del medio ambiente pueda englobarse dentro de los llamados “problemas perversos” (traducción literal de wicked). Pero esta es otra historia…

Para intentar cumplir nuestro objetivo de albergar la incertidumbre en la representación gráfica de la edad de la plantación de los pinares, hemos probado varias aproximaciones. Abajo se describen de manera resumida (salvo la última, en la que nos explayaremos un poco más…)

  • La primera idea que me surgió fue intentar mostrar la incertidumbre (expresada como la diferencia entre las dos fechas de plantación probable) de manera que al aumentar ésta lo hiciera el grado de simplificación geométrica de cada polígono. Algo así como decir que cuanta mayor incertidumbre en la fecha de plantación tiene un polígono, menos nodos tiene y por tanto más se parece a un triángulo (que es el polígono más simple posible). Para hacer esto aplicamos un algoritmo de simplificación (concretamente el que hay implementado en Arcgis 9.2) a cada uno de los polígonos. Estos algoritmos va eliminando puntos del polígono, lo cual implica su progresiva simplificación. Así, la simplificación fue mayor en los polígonos con más incertidumbre. El resultado lo puedes ver más abajo. Aunque la idea original no es mala, estamos incurriendo en un error: asumimos que la incertidumbre se manifiesta gráficamente mediante una reducción en la precisión de la delimitación del polígono. Y eso es incorrecto. La precisión geométrica de todos los polígonos es la misma, ya que han sido digitalizados según una misma metodología (mapa de vegetación a 1:10.000). Digamos que estamos haciendo pagar al contorno del polígono la incertidumbre debida a los atributos que alberga (fecha de plantación). En cualquier caso, el mapa de abajo muestra claramente que hay zonas con poca incertidumbre (polígonos bien definidos: zona norte de Sierra Nevada), frente a otras con mucha indefinición (zona sur, por ejemplo)

ERROR, No pudo mostrarse la pagina.

  • Siguiendo con el mismo razonamiento anterior (tratar de representar la incertidumbre como imprecisión geométrica), intentamos generar una capa tanto más “pixelada” cuanta mayor fuera la incertidumbre de los polígonos. Sería algo así como una capa raster con una resolución espacial variable. Para hacer esto, basta con ir generando rasters con un tamaño de píxel tanto mayor cuanto mayor sea el rango de fechas de plantación para cada polígono. Así, los píxeles más pequeños (140 m) se corresponden con polígonos que tienen un rango de fechas de dos años. Los más grandes (1000 m) corresponden con un rango de 18 años. El resultado es (en mi opinión) más vistoso que el anterior, aunque magnifica ostensiblemente la superficie ocupada por pinares con fecha de plantación cargada de incertidumbre.

ERROR, No pudo mostrarse la pagina.

  • Esta imprecisión alfanumérica hace que en realidad cada polígono tenga varias fechas de plantación posibles. Nos encontramos ante un buen ejemplo de aplicación de la teoría de conjuntos difusos: la llamada lógica difusa. A partir de aquí trataremos de poner en práctica un procedimiento que nos permita representar gráficamente la información que nos interesa (fecha aproximada de plantación), junto con la incertidumbre asociada (rango de fechas de plantación estimadas).
  • Para ello nos basaremos en una metodología diseñada por Tomislav Hengl y descrita en su wiki personal. Se trata de representar gráficamente la pertenencia de una zona determinada (en nuestro caso un pinar) a diferentes clases (en nuestro caso diferentes fechas probables de plantación), teniendo en cuenta que la probabilidad de pertenencia a cada clase es diferente en cada caso. Así, un pinar determinado puede tener una probabilidad de 0.5 de haber sido plantado en 1960 y una de 0.1 de haber sido plantado en 1965, por ejemplo. Esta múltiple pertenencia a varias clases es difícilmente representable de forma gráfica.
  • En virtud de esta metodología, cada clase se corresponde con un color concreto y cada pinar se representará con los distintos colores de las clases para las cuales su probabilidad de pertenencia es mayor que cero. El predominio de un color u otro en cada pinar dependerá de la probabilidad de pertenencia a cada clase. Así, un pinar con una probabilidad de 0.5 de pertenecer a la clase roja y con un 0.1 de probabilidad de pertenencia a otras cinco clases, tendrá la mitad de su superficie coloreada de rojo.
  • Para conseguir la representación de esta pertenencia múltiple a diversas clases, Hengl ha creado un macro implementado en ILWIS. Este programa es un SIG de código abierto y gratuito inicialmente diseñado para la modelización hidrológica. El macro en cuestión toma como punto de partida una serie de capas raster que muestran la probabilidad de pertenencia de cada píxel a cada una de las clases. A partir de este conjunto de capas genera una final en la que cada píxel tiene asociado un color correspondiente a la clase a la que pertenece con mayor probabilidad. El siguiente esquema muestra con detalle los distintos pasos de este macro de ILWIS.




  • Para aplicar esta metodología a nuestros datos, necesitamos asignar una probabilidad de pertenencia de cada pinar a cada clase de edad. Partimos de que cada pinar tiene asignados dos años extremos de plantación probable. Se trata de los límites de un intervalo en cuyo interior está la fecha de plantación con total seguridad. Asumimos que la probabilidad de que un pinar haya sido plantado realmente en estas fechas extremas es mínima (0.1), mientras que es máxima en el año medio de ambas fechas (0.5). Entre este valor medio y los extremos, la probabilidad de ocurrencia baja linealmente. Mediante diversas consultas SQL podemos ir creando los campos necesarios en la tabla de atributos de nuestra capa vectorial original, los cuales contienen la probabilidad de pertenencia a cada clase.
  • Cuando ejecutamos el macro, obtenemos una capa como la inferior. Con esta forma de representar la información sí hemos conseguido compatibilizar la precisión geométrica de los polígonos con la incertidumbre en sus atributos. Los polígonos que tienen píxeles con distintos colores son aquellos que tienen una fecha de plantación más incierta, que oscila entre los dos colores considerados.


ERROR, No pudo mostrarse la pagina.

  • Si ejecutamos el macro en varias ocasiones, obtenemos una distribución diferente de los píxeles pertenecientes a distintas clases. Al representar gráficamente las diversas simulaciones (ejecuciones del macro), se observa un curioso efecto: los píxeles que cambian de color con más frecuencia pertenecen a pinares con una mayor incertidumbre a la hora de definir su fecha de plantación. Podemos ver este efecto en el video inferior y en este kmz (ojo, ocupa 5 megas. Para visualizar, basta con ejecutar el desplazamiento temporal).Tanto en el video como en el kml vemos perfectamente cómo los pinares cuya edad está delimitada con más precisión son los de la comarca del Marquesado. El resto de los pinares tienen una información muy difusa.