Text mining para el análisis de feedback de cliente
tipo de documento semantico ckh_publication
Ficheros
Resumen
Este proyecto desarrollado en la empresa El Corte Inglés se presenta como solución analítica para resolver un problema de negocio que trata de comprender y analizar el feedback de los clientes de la sección de retail de la empresa mediante técnicas de comprensión del lenguaje natural.
En el documento se presenta una adaptación de la metodología CRISP-DM para proyectos de minería de datos y se van recorriendo cada una de las fases realizando una descripción detallada de la solución del problema propuesta.
Además, se realiza una revisión de los avances científicos publicados hasta la fecha en relación con el entendimiento del lenguaje natural y en particular con el problema de clasificación de textos.
Para analizar las valoraciones de los clientes se proponen tres modelos: detección de temáticas, clasificación de textos y análisis de sentimiento. Se utilizan modelos analíticos como el algoritmo LDA para la extracción de temáticas y técnicas de Deep Learning con modelos preentrenados BERT y RoBERTa para la clasificación de textos.
This project developed in the company El Corte Ingles is presented as an analytical solution to solve a business problem that tries to understand and analyse customer feedback from the retail section of the company using natural language understanding techniques.
The paper presents an adaptation of the CRISP-DM methodology for data mining projects and goes through each of the phases with a detailed description of the proposed solution to the problem.
In addition, a review of the scientific advances published to date in relation to the understanding of natural language and in particular to the text classification problem is made.
Three models are proposed to analyse customer ratings: topic modelling, text classification and sentiment analysis. Analytical models such as the LDA algorithm are used for topic extraction and Deep Learning techniques with pre-trained BERT and RoBERTa models for text classification.
Códigos UNESCO CyT
Palabras clave
Editoreak: Comillas , Administradores CKH · Universidad de Comillas
Honekin partekatua:
