Digitalización del proceso de clasificación de los Procedimientos Sancionadores instruidos por la AEPD
tipo de documento semantico ckh_publication
Ficheros
Resumen
Tras varios años desde la aplicación del Reglamento General de Protección de Datos (RGPD) y el consecuente marco sancionador instruido por la Agencia Española de Protección de Datos (AEPD), la cantidad de procedimientos sancionadores ha ido en aumento, así como las multas y sanciones impuestas. Por otro lado, el número de reclamaciones y denuncias recibidas cada año por parte de la AEPD es alarmante y una de las cuestiones que más preocupa a los clientes, es conocer el grado de infracción y aquellas acciones que suponen una sanción administrativa.
Este proyecto surge ante la necesidad de llevar a cabo una digitalización del proceso de análisis de la actividad sancionadora en España y hacer balance con la actividad en el resto de Europa, conocer los sectores y compañías más infractoras, artículos de mayor gravedad y estimar una previsión de qué actividades pueden suponer una sanción económica.
Durante la elaboración del mismo, se ha desarrollado una herramienta para la adquisición mediante scrapeo web de los datos necesarios para realizar el análisis de todos los procedimientos impuestos hasta la fecha desde la aplicación del Reglamento, de igual modo, se ha elaborado el proceso oportuno para el tratamiento y limpieza de los datos, así como su almacenamiento, y se ha desarrollado una digitalización del proceso de clasificación. Para este último paso, se han empleado distintos algoritmos de Machine Learning para llegar al modelo óptimo capaz de clasificar los distintos casos en aquellos que sean procedimientos sancionadores potencialmente sancionables y aquellos que no impliquen una multa administrativa.
El resultado de este proyecto es un informe de valor y una visión general detallada acerca de la actividad sancionadora de la AEPD por la infracción del RGPD en España, además, se sientan las bases y pasos futuros a llevar a cabo conforme vaya aumentando el historial de datos recopilados, el cual se estima que aumente cada año de manera considerable.
After several years since the application of the General Data Protection Regulation (GDPR) and the consequent sanctioning framework instructed by the Spanish Data Protection Agency (AEPD), the number of sanctioning procedures has been increasing, as well as the fines and sanctions imposed. On the other hand, the number of claims and complaints received each year by the AEPD is alarming and one of the issues that most concerns clients is to know the degree of infringement and those actions that entail an administrative sanction.
This project arises from the need to carry out an analysis of the sanctioning activity in Spain and to take stock of the activity in the rest of Europe, to know the most offending sectors and companies, the most serious articles and to estimate a forecast of which activities may entail a financial penalty.
During the development of this project, a tool has been developed for the acquisition based on web scraping techniques of the data necessary to carry out the analysis of all the procedures imposed to date since the application of the Regulation, likewise, the appropriate process for the treatment and cleaning of the data has been developed, as well as its storage, and a digitalisation of the classification process has been developed. For this last step, different Machine Learning algorithms have been used to arrive at the optimal model capable of classifying the different cases into those that are potentially punishable sanctioning procedures and those that do not involve an administrative fine.
The result of this project is a valuable report and a detailed overview of the AEPD's sanctioning activity for breach of the GDPR in Spain, as well as laying the foundations and future steps to be taken as the history of data collected grows, which is expected to increase considerably each year.
Palabras clave
Shared with: