Optimization of machine learning algorithms and data minimization for breast Cancer detection

                                              

Autor/a   

Garriga Guitart, Joan                                           

                                              

Abstract                                             

El cáncer de mama es uno de los cánceres más comunes en las mujeres, con altas tasas de mortalidad. El diagnóstico prematuro y pronóstico del cáncer de mama son clave para reducir la mortalidad. El aprendizaje automático, una aplicación de inteligencia artificial, permite a los ordenadores identificar patrones en bases de datos grandes, ruidosas o complejas. Muy adecuado para aplicaciones médicas, estas técnicas se utilizan en el diagnóstico, clasificación y predicción del cáncer.
Este proyecto tiene como objetivo analizar métodos de clasificación utilizando técnicas de aprendizaje automático para la predicción del cáncer de mama. Se utilizó una base de datos de 30 parámetros, que contenía registros de 569 pacientes. Se propusieron los algoritmos de Regresión logística, K vecinos más cercanos, Bosques aleatorios y Redes neuronales. También se analizó una posible reducción del número de parámetros para la predicción del cáncer.
El algoritmo K vecinos más cercanos fue el que mejor rendimiento general mostró, obteniendo la mayor precisión, valor F1 y valor ROC-AUC. La reducción de parámetros mostró resultados prometedores. Se puede realizar una reducción de más del 50% de los datos de entrada obteniendo resultados satisfactorios. Esto podría tener un gran impacto en el sistema sanitario, reduciendo el número de pruebas médicas y, por tanto, ahorrando tiempo, gastos y molestias causadas a los pacientes.

Palabras clave: aprendizaje automático, cáncer de mama, Python.                                           

                                              

                                              

 

                                              

                                              

Director/a                                              

Fernández Esmerats, Joan                                              

                                              

Estudios                                              

IQS SE - Grado en Biotecnología                                            

                                              

Fecha                                              

2020-06-15