Development of Machine Learning algorithms for Breast Cancer prediction

Autor/a

Tortós-Sala Granés, Carla  

Abstract

El cáncer de pecho, como el cáncer en general, es un crecimiento descontrolado de las células. Es decir, un tumor maligno que se ha desarrollado en las células del pecho. Este tumor puede empezar a desarrollarse en la zona de los lóbulos, allí donde se encuentran las glándulas que segregan y producen la leche o bien en el duct, por donde la leche pasa desde los lóbulos al pezón. Sin embargo, también existe una pequeña posibilidad de que este tumor se origine en el estroma. Una de cada ocho mujeres es diagnosticada con cáncer de mama a lo largo de su vida, siendo así el cáncer más común entre el sexo femenino. A pesar de esta prevalencia, en detectado cuando se encuentra en estadios iniciales, la probabilidad de recuperarte es muy elevada. El objetivo principal de este TFG consiste en generar modelos de Machine Learning para poder predecir el tratamiento óptimo para pacientes oncológicos. Trabajaremos con modelos de K-NN (K-Nearest Neighbor) y Random Forest Clasificación. Además, realizaremos un estudio de transferibilidad de los modelos generados entre conjunto de datos. También se llevará a cabo un estudio de feature importance para identificar como de significativas son las variables en el conjunto de datos. Los resultados del estudio mostraron que, tan sólo con cinco parámetros, el modelo podía llegar a tener una precisión superior a la obtenida con todos los parámetros, tanto de validación como los de prueba. Esto demuestra la viabilidad de los algoritmos de aprendizaje automático para la predicción precisa del cáncer.

 

Director/a

Fernández Esmerats, Joan 
 

Estudios

IQS SE - Grado en Farmacia

Fecha

2020-07-07