Dando voz a la depresión

Carmen Martínez Antón

Durante las últimas décadas, el desarrollo de tecnologías del habla ha ido incrementando de manera exponencial debido al modo en que éstas pueden llegar a facilitar nuestras vidas. El habla representa el medio de comunicación más característico del ser humano, pues nos permite transmitir ideas, conocimientos, pensamientos, peticiones y, quizás incluso sin poder evitarlo, el estado de ánimo en el que nos encontramos en un preciso momento.

Posiblemente, todos hemos conocido, o estado en contacto alguna vez, con una persona que padeciera depresión. Se suele decir que están tristes, apagadas o faltas de motivación en su día a día. Sin embargo, lo que no se sabe, es que se trata de una enfermedad mental mucho más compleja y extendida de lo que uno podría llegar a pensar. De hecho, acaba condicionando la vida de quien la sufre, tanto a nivel social como laboral. Por ejemplo, algo que podría parecer tan sencillo como quedar con amigos o acudir al trabajo acaba siendo “un mundo” para estas personas. Este estrés es el desencadenante más importante (y a la vez uno de los grandes factores de riesgo) de esta enfermedad. Este “miedo” o “pasividad” no sólo refleja lo que está ocurriendo en sus cabezas a nivel hormonal, sino que también afecta a su voz, la cual acaba siendo bastante monótona, pausada, llana o incluso temblorosa.

Las técnicas de diagnóstico que se utilizan hoy en día para detectar la depresión no son del todo fiables. Por lo general, se limitan a entrevistas subjetivas cuya eficacia depende, en gran medida, de que los sujetos estén o no dispuestos a colaborar con sus respuestas. Estos cuestionarios pueden incluir preguntas que abarcan temas más simples y otros más complejos de responder, yendo desde la cantidad de horas que han dormido últimamente hasta la existencia de pensamientos suicidas o su interés sobre el sexo en la actualidad.

Sabiendo esto, no debería resultar descabellada la idea de intentar aunar hechos perceptibles que caracterizan esta enfermedad, como el tono de voz, con la intención de mejorar el diagnóstico actual. ¿Qué pasaría si se unieran la posibilidad de registrar las diferencias en las voces de las personas, según padecen o no esta enfermedad, con su distinta reacción al estrés? Quizás realizando una prueba de estrés controlado pueda ayudar a obtener un mejor diagnóstico para estos pacientes. ¿Y si, además, se les grabara su voz dado que resulta tan característica?

Extracto de los tres niveles de dificultad del test de Stroop usados para generar estrés en los sujetos analizados.

Realmente, ya contamos con la tecnología necesaria para ello: basta con un teléfono móvil que muestre en pantalla algo que cause estrés a la persona y, simultáneamente, registre su voz para realizar el diagnóstico. A partir de esa grabación, se podrían calcular parámetros que detectaran la posible existencia o no de la enfermedad. Estos parámetros podrían ser la cantidad de tiempo que se habla durante un tiempo determinado (por ejemplo, grabar un audio de un minuto) y/o la monotonía de su voz a lo largo de la grabación. Para ello, se podría utilizar un nivel de estrés controlado como el Test de Stroop, donde básicamente se debe decir en voz alta los colores “rojo”, “verde” o “azul” en que están escritas las propias palabras “rojo”, “verde” o “azul”; las cuales nunca son coincidentes y genera así una mayor dificultad.

Cada día que pasa, la tecnología avanza y, con ello, la posibilidad de “sacar de la consulta” ciertos indicios de una enfermedad, previos a la realización de pruebas más costosas que aseguren el diagnóstico.

Prototipo de aplicación móvil de monitoreo y diagnóstico de la depresión mediante el uso de la voz.

Actualmente, esta línea de investigación está en pleno desarrollo. Como parte de mi trabajo de fin de máster, primero tuve la oportunidad de colaborar con el análisis de una base de datos con individuos controles y depresivos. En concreto, buscamos características en la voz que se comportasen de manera diferente entre ambas poblaciones, e incluso entre las mismas poblaciones (esto es, comparando las voces del grupo control entre ellos y las voces del grupo depresivo entre ellos), a lo largo de las diferentes etapas del test de estrés. Sin embargo, tras observar que los resultados obtenidos en esta primera etapa eran muy prometedores, vimos que este análisis podría llevarse a un siguiente nivel de complejidad utilizando métodos muy sencillos de machine learning para mejorar la clasificación de los invidividuos en función de su voz. Básicamente, utilizando una serie de parámetros, tanto de voz como de otras señales fisiológicas, el algoritmo utilizado por el ordenador debería ser capaz de separarnos las poblaciones de controles y depresivos de manera que, al introducir un nuevo sujeto, se clasifique como parte de uno u otro grupo acorde a los parámetros específicos de este nuevo sujeto.

De momento, todo esto no es más que una propuesta de mejora que podría hacerse realidad cuando la tecnología adecuada esté a nuestro alcance. No obstante, puede que en un futuro no muy lejano podamos contar con este “test de screening” para diferentes enfermedades mentales. Esto permitiría disponer de un método más rápido para detectar dichas enfermedades, mejorando así la calidad de vida de aquellos que las padecen y; por supuesto, permitiendo ponerle una solución más rápida a estos trastornos.

 

* * *

Por Carmen Martínez Antón, Investigadora (N3) en los grupos ViVoLab y BSICoS del Instituto de Investigación de Aragón, Universidad de Zaragoza. BSICoS es un grupo que forma parte del CIBER de Bioingeniería, Biomateriales y Nanomedicina y del Instituto de Investigación Sanitaria de Aragón.

 

Etiquetas: