CompartidoEl 23/01/24 por Comillas
Trabajo fin de máster

Centralización del dato en la nube. Arquitectura, herramientas de visualización e implementaciones.

tipo de documento semantico ckh_publication

Ficheros

Resumen Trabajo Fin de Máster
TFM - Cardenal Real de Asua, Pablo.pdf
Tamaño 4752301
Formato Adobe PDF
Resumen Autorización
AnexoI.pdf
Tamaño 39421
Formato Adobe PDF
Fecha de publicación 00/00/2023
Director/Coordinador
Meseguer López, María Victoria
Autor
Cardenal Real de Asúa, Pablo

Resumen

Idioma es-ES
Resumen

Uno de los pasos más importantes en la transformación digital es la creación, diseño e implementación de una infraestructura capaz de extraer el mayor valor a los datos. Debe ser capaz de unificar, limpiar y preparar los datos presentes y futuros con tal de que se puedan realizar labores de ciencia de datos, mejora de servicios o explotación comercial. Además, también debe ser capaz de aislar los datos con un control muy granular para poder limitar el acceso de usuarios con menor autorización.
El objetivo de este proyecto es apoyar en la construcción y definición del departamento del dato. Para ello es necesaria la creación de una base de datos adecuada a las necesidades técnicas y financieras, así como herramientas por las que explotarlo. En este trabajo se estudiarán las diferentes bases de datos Cloud disponibles en el mercado, adquiriendo la que más se adecúe a nuestras necesidades. Se considerarán herramientas de extracción, transformación y carga, así como sistemas de almacenamiento donde guardar los datos previamente tratados. Se estudiarán los aspectos técnicos, su compatibilidad con el resto de servicios incluidos en la empresa y los costes asociados. Una vez realizado el estudio se explicará su puesta en producción, desde la creación de \textit{scripts} que introduzcan datos en el nuevo servicio de almacenamiento hasta las primeras soluciones aportadas por esta infraestructura. Para ello será necesario entender la arquitectura y funcionamiento de las herramientas seleccionadas para poder aprovechar al máximo sus ventajas. También se estudiará también la creación de una herramienta de visualización compatible con las necesidades financieras y, simultáneamente, capaz de explotar los datos al más alto nivel. Finalmente, se describirán los primeros pasos de la inclusión de un servicio de ingesta de datos externo.

Idioma en-GB
Resumen

One of the most important steps on the process of digital transformation is the design, creation, and implementation of an infrastructure able to get the most value of the available data. It must be able to unify, clean and preprocess the present and future data in order to support developments in data science tasks, help on the improvement of existing services or allow the commercial exploitation of them. On top of that the infrastructure must be able to control access to the data in a very granular way so than unallowed users cannot read restricted data.
The aim of this project is to support the creation and definition of the Data Department. In order to achieve this goal, the creation of a data base in line of technical and financial needs, on top of tools to exploit the stored information is imperative. This document will study the available services available on the market, both for tools to extract and transform the data as well as Cloud data warehouses. To explain why the chosen services fit best to the current needs it will need to explore the technical characteristics and how well they fit into the existing services on the company, as well as the costs associated with them. Once the study has been finished it will be explained how it has been put into production, from the development of the scripts responsible of inserting data into the new data base to the first solutions provided by this new infrastructure. To do that it will be necessary to understand the underlying architecture of the chosen tools and their functionalities so that they can be best taken advantage of. It will also be studied the creation of a data visualization tool able to exploit the data on every level, compatible both with technical and financial needs. Finally, the first steps towards the inclusion of external data sources will be included, with a high emphasis on the creation of a data catalog.

Titulación/Programa
Máster en Big Data. Tecnología y Analítica Avanzada/Master in Big Data Technologies and Advanced Analytics
Centro
Escuela Técnica Superior de Ingeniería (ICAI)

Palabras clave

Tipo de archivo application/pdf
Idioma es-ES
Tipo de acceso info:eu-repo/semantics/closedAccess
Licencia http://creativecommons.org/licenses/by-nc-nd/3.0/us/
Fecha de modificacion 20/07/2023
Fecha de disponibilidad 30/05/2023
fecha de alta 30/05/2023

Editors: Comillas , Administradores CKH · Universidad de Comillas

Shared with: