Development of Machine Learning Models to Identify the Source of Defects in Steel Slabs due to their Treatment in a Tunnel Furnace
tipo de documento semantico ckh_publication
Ficheros
Resumen
La adaptación de las empresas e industria a las nuevas tecnologías que incluye la industria
4.0 puede parecer al principio un gasto costoso e inecesario debido a la poca mejoría que se
puede percibir en algunos casos. Sin embargo, la optimización de los procesos que habilita
la inclusión de tecnologías como el Internet de las cosas (IIoT), el Big Data, y el uso de los
sistemas ciberfísicos entre otras, es abismal.
En este Trabajo Fin de Máster, se emplean técnicas de Machine Learning en un sector
(industria pesada) el cual, a primera vista parece que ya están todos los componentes bien
optimizados, dando lugar a la idea de que hay poco espacio de mejora. Además dichas
mejoras pueden resultar caras por el tamaño de máquinas e instalaciones empleadas, y por
lo tanto inatractivas desde el punto de vista de los inversores. Este trabajo forma parte de un
proyecto de consultoría encargado a GHI Hornos Industriales S.L. por Arcelormittal Sestao
S.L. subvencionado por el programa Hazitek, que aboga por el I+D+i en las empresas del País
Vasco.
El objetivo de este trabajo era detectar qué elementos de un Horno Túnel (HT) de 187,2
metros de longitud, participante en el proceso de producción de planchones de acero son los
principales causantes de defectos en los planchones de acero.
Para alcanzar este objetivo, primero se estudiaron los defectos que más ocurrían en esta
planta para averiguar sus causas y poder ligarlas con el funcionamiento del HT. Los datos
proporcionados por el cliente Arcelormittal estaban distribuidos en distintos archivos. La calidad
y coherencia de los datos no era óptima, por lo que se invirtió una gran cantidad de tiempo
limpiando y sincronizando observaciones. Una vez consolidados los datos, se realizó un extenso
análisis exploratorio del HT para entender el proceso y hacer una primera criba de variables
significantes a utilizar en los modelos. Luego, se entrenaron distintos tipos de modelos de
clasificación con la finalidad de evaluar sus precisiones clasificando y los cálculos implícitos de
las importancias de las varibles. Se probó con modelos k-NN, MLP y Random Forest. Además se
hizo una prueba de RFE (Eliminación de Característica Recursiva) con el paquete caret.
No se pudieron obtener conclusiones ni soluciones evidentes dado el pobre rendmiento de
los modelos. Se argumenta la falta de variables relevantes y de sensores que podrían haber
aportado información de mayor utilidad. Sin embargo, sí que se hacen algunas sugerencias para
mejorar el funcionamiento, basadas en la delicada interpretación de los resultados.
Adaptation of Industry 4.0 elements in factories and industry in general, at first can be seen as
expensive and unnecessary due to the significant investment it can imply, and the little ‘visible’
positive outcomes it generates. However, the optimization in the process that it enables does
have a direct impact in the reduction of overall costs giving a larger benefit margin. This is why
industry 4.0 is the new industry. Big data, Internet of Things (IoT), Cyber-physical systems and
machine learning algorithms and Digitalization are having a broad impact in how the industry
it is applied to, operates.
In this Thesis, Machine Learning is applied to a sector (heavy industry) which seems already
consolidated and that at a first glance someone would imagine it is not necessary for the small
space of amelioration that it has. In addition, the improvement from applying these techniques
may result unattractive due to the important investment any upgrade in this sector require
(larger machines and installations will have greater costs). The Thesis is done as part of an
advisor project commissioned to ‘GHI Hornos Industriales’ by Arcelormittal Sestao.
The objective of this thesis is to detect which elements in a 187,2 metre long Tunnel Furnace
(TF) are causing defects on the steel slabs that must go through the furnace in a real secondary
steel manufacturing process.
To accomplish the objective, first the most common defects were studied to find probable
causes. Data was provided by the client Arcerlormittal in different files. Quality and coherence
of the data was not the optimal, making cleaning and synchronisation of data an arduous
task. Once the whole dataset was consolidated, an extensive exploratory analysis of the Tunnel
Furnace was performed to understand the process and make a preliminary feature selection.
ML was then applied by fitting different type of classification models, evaluating their accuracy
and then calculating each predictor’s importance within the classifier. A k-NN, an MLP and a
Random Forest were the candidate models. A test with an RFE function from the caret Package
was also carried out.
Direct and definite findings and solutions were difficult to obtain due to the inaccurate and
ineffective fitted models. Missing relevant sensors in the TF to capture important features are
specially accounted for. However, suggestions on possible improvements were made, basing
them on assumptions coming from the delicate interpretation of the results.
