Plataforma de integración y gestión de datos geolocalizados destinados a mejorar la eficiencia agraria de los cultivos
- Álvaro Huertas Martín. TFG en Grado en Ingeniería Informática en Ingeniería de Software de la UEx. Codirigido por Félix Rodríguez Rodríguez y José Luis González Sánchez.
Es un hecho que las nuevas tecnologías están llegando con retraso al sector agropecuario en Extremadura, creando una gran desigualdad respecto a otros sectores como la industria alimentaria. Este problema se ve acrecentado ante una demanda de productos del sector agrícola y ganadero que va en aumento y que resulta en un mercado basado en la importación de productos del exterior y en la producción de productos de baja calidad. Esto supone un reto para el sector tecnológico de la región. Es por ello que se deben proponer soluciones para la mejora de la producción agrícola y ganadera y paliar esta desigualdad entre la oferta y la demanda.
Entre todos los objetivos que pueden ser acometidos por la tecnología para avanzar en este sector, este Trabajo de Fin de Grado se centra en los datos abiertos que, junto a tecnologías tan actuales como el Big Data o el aprendizaje automático ponen al alcance de cualquiera el desarrollo de herramientas beneficiosas para el entorno.
Su finalidad es la creación de un sistema que aporte valor al desarrollo de tecnologías vinculadas a la agricultura de precisión nutriéndose de medios como las fuentes de datos abiertos. Los objetivos específicos que se persiguen son los siguientes:
- Análisis, diseño, implementación y evaluación de rendimiento de una plataforma de fuentes de datos públicas y abiertas en el sector agrario y agroalimentario.
- Estudio de la viabilidad de uso de repositorio centralizado, distribuido o híbrido en la plataforma Open Data.
- Evaluación técnica para la elección del Sistema Gestor de Bases de Datos (SGBD).
El proceso de desarrollo completo de la plataforma se culmina satisfactoriamente. Se realiza la implementación completa de un sistema para consultas en el portal Eurostat y el portal INE, mientras que se han dejado sentadas las bases para que en futuras fases del proyecto se añadan el resto de fuentes de datos abiertos con los que se desee trabajar. Para favorecer la ampliación de la plataforma se sigue un diseño modular. En lo referente al estudio de viabilidad de uso de un repositorio centralizado, distribuido o híbrido, se decide usar un repositorio centralizado. El resultado del modelo seleccionado es satisfactorio para las fuentes de datos elegidas, además, debido al diseño que ha adoptado el repositorio, será fácilmente ampliable en futuras fases del proyecto. Por último, en lo referente a la elección del Sistema de Bases de Datos, se utiliza un sistema no relacional, siguiendo un modelo NOSQL, donde los datos se almacenan en forma de documentos. Éstos presentan una estructura flexible, sin un esquema prefijado, lo cual favorece la inclusión de datos de diversas fuentes de forma sencilla. Actualmente la base de datos del repositorio cuenta con unos 300.000 registros y el rendimiento es óptimo, pero si el proyecto crece, el número de registros irá aumentando y siempre se podrá cambiar el modelo del repositorio al tipo híbrido.