Presente y futuro de los formatos GIS - Capítulo I
En el universo del GIS existen muchos mundos y uno de los más importantes y cambiantes es el de los formatos.
La incorporación de los sistemas de información geográfica (GIS) a más ámbitos y disciplinas, ha derivado en un crecimiento notable del número de formatos GIS disponibles.
¿Qué es un formato GIS?
Es la manera en que se almacena de forma codificada, información geográfica vectorial o raster, en un fichero o base de datos.
En este primer capítulo hablaremos del presente y futuro de los formatos para tratar datos vectoriales, formas geométricas diferenciadas entre puntos, líneas y polígonos en 2D. En capítulos posteriores hablaremos de la gestión en bases de datos geoespaciales y de los formatos más adecuados para tratar datos en 3D.
Shapefile, un clásico
Creado por ESRI (ArcGIS) hace más de 25 años, es compatible con cualquier software GIS. El más extendido, aceptado y utilizado.
A nivel estructural, cada shapefile puede representar un único tipo de geometría (punto, línea o polígono) y consta de 7 subficheros. De estos, hay tres que son obligatorios: *.shp (geometrías), *.dbf (tabla de atributos asociada) y *.shx (índice para las geometrías). Por otro lado, hay cuatro más de uso opcional aunque recomendado: *.prj (sistema de coordenadas y proyección), *.sbn y *.sbx (índice espacial para la optimización de consultas) y *.xml (metadatos).
Como puntos a favor juega su popularidad y aceptación general, así como la facilidad para la conversión a otros formatos. También resulta práctico para poder consultar la tabla de atributos (*.dbf) sin necesidad de programario GIS.
En contra nos encontramos con la necesidad de tener un mínimo de tres subficheros para tratar un solo tipo de geometría. La medida máxima del formato es de 2 Gb, hay un límite de 10 caracteres para el nombre de los campos y 254 para el contenido de cada registro existente en la tabla de atributos (*.dbf). Se tiene que tener en cuenta que no tiene la capacidad para tratar datos raster.
Resumiendo, la facilidad para la conversión a otros formatos, así como el uso generalizado en la mayoría de instituciones, hacer que siga siendo el más extendido. No obstante, la aparición de nuevos formatos más optimizados y compactos, sin las limitaciones que acabamos de detallar, nos hacen pensar que su horizonte de obsolescencia no es muy lejano.
Geopackage, el aspirante
Con 10 años de existencia, totalmente abierto y transversal, está preparado para tratar grandes volúmenes de datos con geometrías complejas.
Estructuralmente, estamos frente a un único fichero *. gpkg, capaz de almacenar varios tipos de geometrías. Empaquetado en forma de contenedor SQLite (motor de base de datos más usado en el mundo), tiene características similares a las de una base de datos geoespacial, haciendo que podamos hablar de una base de datos personal.
A favor juega su optimización, ya que con un solo fichero podemos almacenar varios tipos de geometrías. Tiene capacidad para tratar geometrías complejas, así como datos raster. Puede almacenar volúmenes de datos incluso superiores a los 100 Tb, sin limitaciones en el número de caracteres para campos y registros.
En contra podemos considerar que, al ser un formato relativamente nuevo, aún no está muy extendido. Por otro lado, la complejidad de su estructura interna provoca que sea imprescindible el uso de programas GIS para poder consultar la información almacenada.
En resumen, la optimización del empaquetado, las buenas prestaciones de almacenamiento y la capacidad para tratar geometrías complejas, hacen que se postule como claro aspirante a ser el formato GIS más popular en los próximos años.
File Geodatabase, la apuesta de ESRI
Es el formato de ESRI con el que, por defecto, se crean nuevos datos con su herramienta GIS desktop (ArcGIS PRO).
Su estructura se basa en un conjunto de ficheros empaquetados que emulan a una geodatabase para su uso en un ámbito local. En este caso también podemos hablar de una base de datos personal, permitiendo contener varios tipos de geometrías vectoriales, así como datos raster.
Como puntos a favor tenemos que se trata de un solo paquete de ficheros capaz de almacenar varios tipos de geometrías. Dentro de un entorno ESRI, las funcionalidades que presenta son las equivalentes a las de una geodatabase
Un punto fundamental en contra es que estas funcionalidades de geodatabase se pierden cuando no se trabaja con ArcGIS PRO (ESRI). Por otro lado, tal como pasa con Geopackage, la información no es consultable sin un programario GIS.
En definitiva, se trata de una buena opción para trabajar en ámbito local con las funcionalidades de una base de datos. El inconveniente es que muchas de estas funcionalidades quedan restringidas cuando se trabaja con herramientas GIS fuera del mundo ESRI.
GeoJSON, el más ágil
Creado en el año 2008, aunque liberado para su uso en 2016, es el formato más útil para intercambiar datos, trabajando en un entorno web con un formato sencillo y ligero.
A nivel de estructura, es muy similar al de un JSON ya que es el formato en el que está basado. Se trata de una evolución que incorpora la capacidad de administrar geometrías vectoriales simples.
Sus principales puntos favorables son su ligereza y simplicidad; como la base es el formato JSON, es consultable como fichero plano. Por otro lado, se puede considerar como uno de los más utilizados para la creación de aplicaciones web.
En contra nos encontramos que no está preparado para tratar geometrías complejas y presenta limitaciones para poder llevar a cabo análisis espaciales.
Como resumen, podemos decir que es el formato más ágil para el intercambio y generación de web apps, siempre que se trabaje con geometrías de poca complejidad.
Conclusiones
Determinamos que hay dos formatos “ganadores” que son totalmente compatibles, con aplicabilidad distinta en función del propósito.
El Geopackage, para trabajar con un fichero compacto, que sea apto para grandes volúmenes de datas y con capacidad para ejecutar análisis geoespaciales.
El GeoJSON, para el intercambio ágil, en el marco de las aplicaciones web y alojando datos sin gran complejidad. Es exportable, convertible y legible.
Por otro lado, podemos decir que, aunque su popularidad persiste, estamos encarando el final de la era del Shapefile.
Aunque en este artículo no hemos entrado y su protagonismo es aún relativo, los mapas en 3D se deben tener en cuenta. Podemos prever que, el crecimiento en su uso, marcará la evolución de los formatos en los próximos años. En cualquier caso, ya lo dejamos para otro capítulo.
Roger Conesa, arquitecte GIS