Ejecución de pilotos para validación de modelos predictivos (recuperaciones)
tipo de documento semantico ckh_publication
Ficheros
Resumen
La fase de validación de los pilotos es una prueba real en la operativa diaria que se lleva a cabo empleando aquellos nuevos expedientes impagados y que se reciben de forma diaria, más los que siguen en estado de incidencia. Mas concretamente, se trata de la fase en que se desarrolla el código necesario para estudias la efectividad de la salida de los modelos, así como el desempeño de las estrategias definidas previamente. Por otro lado, se trata además de la fase en la que se prepara el código para su puesta en producción, ajustando los parámetros que sean necesarios (capacidad de procesamiento, ruta de las variables de entrada, etc.) y se desarrolla una herramienta para visualizar los resultados.
El desarrollo de la fase de pilotos se ha dividido en 3 bloques principales: desarrollo preliminar, lanzamiento de los pilotos y visualización de resultados. El primer bloque, éste es, el correspondiente al desarrollo preliminar, incluye la comprobación del formato de salida del modelo, el desarrollo en local empleando Python (scripts de clasificación en matrices y en grupos de test y control), el análisis de los resultados obtenidos (correspondientes a expedientes impagados), así como la comparativa en acierto en predicción. En cuanto al segundo bloque, correspondiente al lanzamiento de los pilotos, éste incluye el desarrollo en remoto (desarrollo en distribuido empleando PySpark, “traduciendo” el código desarrollado en local con Python), la creación del código de lanzamiento del piloto y la realización de acciones complementarias necesarias para una correcta ejecución de los pilotos. Finalmente, el último bloque corresponde a la visualización de los resultados obtenidos durante el lanzamiento del piloto. Así, se crea, junto al equipo de negocio, un cuadro de mando en Power BI.
The validation phase of the pilots is a real test in daily operations that are carried out using those new unpaid files that are received daily, plus those that are still in a state of incidence. More specifically, this is the phase in which the necessary code is developed to study the effectiveness of the models' output, as well as the performance of the previously defined strategies. On the other hand, it is also the phase in which the code is prepared for production, adjusting the necessary parameters (processing capacity, input variable routing, etc.) and developing a tool to visualize the results. Thus, the objectives of the pilot phase can be summarised in 3: development of the categorization code in the matrices and putting it into production, creation of a control system, and validation of the results of the strategies.
The development of the pilot phase was divided into 3 main blocks: preliminary development, launching of the pilots, and visualization of the results. The first block, i.e. preliminary development, includes checking the output format of the model, local development using Python (classification scripts in matrices and in test and control groups), analysis of the results obtained (corresponding to unpaid files), as well as a comparison of prediction accuracy. The second block, corresponding to the launch of the pilots, includes remote development (distributed development using PySpark, "translating" the code developed locally with Python), the creation of the pilot launch code, and the performance of complementary actions necessary for the correct execution of the pilots. Finally, the last block corresponds to the visualization of the results obtained during the launch of the pilot. Thus, a Power BI dashboard is created together with the business team.