Development of a Local Data-Warehouse for database integration and analysis: Uncovering the sequence-activity relations

Autor/a

Novoa Rojas, Yago 

Abstract

Las bases de datos han existido desde los años 60, con el boom de la información del proyecto del genoma salieron a la luz muchas bases de datos específicas, en esa época aparecieron las bases de datos relacionales y han sido un elemento básico en la gestión de datos desde entonces. Esta tesis tiene como objetivo utilizar un almacén de datos no relacional y un sistema de gestión de datos del servidor de bases de datos relacionales para almacenar y visualizar información procedente de diferentes bases de datos heterogéneas. El objetivo principal del estudio fue desarrollar e implementar una línea de trabajo para extraer e integrar los datos, así como realizar una rutina de selección y análisis de los datos recuperados para facilitar su acceso a la comunidad de aprendizaje. La integración de bases de datos heterogéneas necesitaba el diseño o una base de datos de fácil mantenimiento y una aplicación de visualización fácil de usar. Después de estudiar diferentes enfoques, se eligieron PHP y MySQL para la gestión y visualización de bases de datos, ya que ambos lenguajes brindan ventajas para sus respectivos campos de uso. Se logró la generación de un data warehouse, un servidor SQL y una aplicación de visualización, accesible para los usuarios.
Todo el trabajo descrito en esta tesis es un paso hacia la integración de múltiples bases de datos biológicas en una sola base de datos unificada haciendo uso de programación in silico y rutinas de minería de datos e integración de datos.

 

Director/a

Biarnés Fontal, Xavier

Estudis

IQS SE - Máster en Bioingeniería

Fecha

2020-07-14