Development of Machine Learning algorithms for Breast Cancer prediction

Autor/a

Tortós-Sala Granés, Carla  

Abstract

El càncer de pit, com el càncer en general, és un creixement descontrolat de les cèl·lules. És a dir, un tumor maligne que s'ha desenvolupat en les cèl·lules de pit. Aquest tumor pot començar a desenvolupar-se en la zona dels lòbuls, allà on es troben les glàndules que segreguen i produeixen la llet o bé en el ducte per on la llet passa des dels lòbuls al mugró. No obstant això, també hi ha una petita possibilitat que aquest tumor s'origini en l'estroma. Una de cada vuit dones és diagnosticada amb càncer de mama al llarg de la seva vida, sent així el càncer més comú entre el sexe femení. Malgrat aquesta prevalença, en detectat quan es troba en estadis inicials, la probabilitat de recuperar-te és molt elevada. L'objectiu principal d'aquest TFG consisteix a generar models de Machine Learning per poder predir el tractament òptim per a pacients oncològics. Treballarem amb models de K-NN (K-Nearest Neighbor) i Random Forest Classificació. A més, realitzarem un estudi de transferibilitat dels models generats entre conjunt de dades. També es durà a terme un estudi de feature importance per identificar com de significatives són les variables en el conjunt de dades. Els resultats de l'estudi van mostrar que, tan sols amb cinc paràmetres, el model podia arribar a tenir una precisió superior a l'obtinguda amb tots els paràmetres, tant de validació com els de prova. Això demostra la viabilitat dels algoritmes d'aprenentatge automàtic per a la predicció precisa de el càncer.

 

Director/a

Fernández Esmerats, Joan 
 

Estudis

IQS SE - Grau en Farmàcia

Data

2020-07-07