En esta tesis, Saraí Roque Rodríguez analiza señales obtenidas de un actígrafo (dispositivo digital, "reloj" que registra el movimiento), para determinar si la persona tiene depresión o no la tiene. La tesis completa puede descargarse aquí.
Resumen. Los trastornos mentales están en aumento a nivel global, afectando a aproximadamente una décima parte de la población. La depresión se posiciona como el segundo trastorno más común. A diferencia de otras condiciones de salud, los expertos en este campo suelen emplear un enfoque tradicional para el diagnóstico. Sin embargo, actualmente, se han desarrollado enfoques basados en datos, como el fenotipado digital para la salud mental, con el objetivo de implementar sistemas que faciliten o sirvan como herramienta en el diagnóstico de condiciones mentales, incluida la depresión.
El propósito de este documento es clasificar a las personas en dos grupos: personas con depresión y un grupo de control, utilizando registros de actividad motriz obtenidos de un actígrafo móvil. Esto se logró aplicando herramientas de minería de datos y aprendizaje automático, mediante una metodología basada en el proceso KDD y el enfoque de FDSM. Este proceso incluye la selección de datos, preprocesamiento, minería de datos y la presentación de resultados.
Se utilizó la base de datos Depresjon, la cual está disponible y abierta para su uso en investigaciones, y contiene registros de actividad motriz de 55 personas en intervalos de un minuto durante aproximadamente dos semanas. Estos registros se caracterizaron mediante un "vector de características" calculado a partir de la extracción de tres atributos por día, basados en el nivel de actividad registrado. Se llevó a cabo un análisis exploratorio que incluyó un análisis estadístico general y la aplicación de pruebas de independencia.
Se implementaron modelos de aprendizaje automático para la clasificación y el método de validación LOSO, enfocados en el diagnóstico de la depresión a partir de datos. Los clasificadores utilizados incluyen el bosque aleatorio, redes neuronales multicapa, árboles de decisión y k vecinos más cercanos. La implementación se realizó en Python en un entorno de Jupyter, con las bibliotecas correspondientes. La etapa de clasificación se definió en dos experimentos:
Experimento I: Clasificación del trastorno depresivo en pacientes a partir de la actividad motriz, basada en los métodos del estado del arte.
Experimento II: Clasificación del trastorno depresivo en pacientes a partir de la actividad motriz utilizando más características de entrada para los modelos de aprendizaje automático.
Ambos experimentos presentaron resultados satisfactorios, demostrados por las métricas de exactitud obtenidas para la clasificación binaria. Estos resultados superaron los obtenidos en trabajos previos que emplearon el mismo conjunto de datos, resaltando la efectividad y el potencial de este enfoque como herramienta de diagnóstico.
Palabras clave: Fenotipado Digital, depresión, minería de datos, KDD, aprendizaje automático, clasificación, random forest, árbol de decisión, k vecinos más cercanos, redes neuronales MLP.
El 1 de febrero de 2024, Saraí obtuvo su grado de Maestro en Ciencias de la Computación, en el CIC IPN.