Herramienta de investigación basada en NLP para la generación de contenido automatizada
tipo de documento semantico ckh_publication
Ficheros
Resumen
Este proyecto tiene como objetivo crear un meta buscador semántico de insights, que permita generar conocimiento sobre un tema dado, usando técnicas de web-scraping, y mediante la creación de un buscador semántico a partir de técnicas de NLP.
En este trabajo se describirán los procesos seguidos para elaborar el buscador, como son la obtención de datos y el uso de modelos de Transformers para conseguir una herramienta de Question and Answering para así obtener respuestas a las preguntas o palabras clave consultadas.
Se tratarán dos casos de uso: uno de tema específico (Annual Reports), y otro sobre un tema genérico (que en este caso será Industria Farmacéutica). Para cada uno de estos casos de uso, se detallarán los procesos de ingesta de datos, así como las diferencias entre un tema específico y otro general, y la creación de un buscador semántico, que genere insights ante las preguntas sobre los temas. También se explicarán los resultados obtenidos para cada fase, y como herramienta en su conjunto.
The objective of this project is to create a semantic meta-search engine of insights, which allows to generate knowledge about a given topic, using web-scraping techniques, and through the creation of a semantic search engine from NLP techniques.
This paper will describe the processes followed to develop the search engine, such as data collection and the use of Transformers models to get a Question and Answering tool to obtain answers to the questions or keywords queried.
Two use cases will be dealt with: one on a specific topic (Annual Reports), and the other on a generic topic (in this case, the Pharmaceutical Industry). For each of these use cases, the data ingestion processes will be detailed, as well as the differences between a specific topic and a general one, and the creation of a semantic search engine, which generates insights in response to questions about the topics. The results obtained for each phase, and as a tool as a whole, will also be explained.
Códigos UNESCO CyT
Palabras clave
Editores: Comillas , Administradores CKH · Universidad de Comillas
Compartida con:
