Este artigo faz parte uma série limitada sobre o potencial da inteligência artificial para resolver problemas cotidianos.
Imagine um teste tão rápido e fácil quanto medir sua temperatura ou sua pressão arterial que possa identificar com segurança um transtorno de ansiedade ou prever uma recaída depressiva iminente.
Os prestadores de cuidados de saúde têm muitas ferramentas para avaliar a condição física de um paciente, mas nenhum biomarcador confiável – indicadores objetivos de estados médicos observados de fora do paciente – para avaliar a saúde mental.
Mas alguns pesquisadores de inteligência artificial agora acreditam que o som da sua voz pode ser a chave para entender seu estado mental – e a IA é perfeitamente adequada para detectar essas mudanças, que são difíceis, se não impossíveis, de perceber de outra forma. O resultado é um conjunto de aplicativos e ferramentas online projetados para rastrear seu estado mental, bem como programas que fornecem avaliações de saúde mental em tempo real para provedores de telessaúde e call center.
Os psicólogos sabem há muito tempo que certos problemas de saúde mental podem ser detectados ouvindo não apenas que uma pessoa diz mas quão eles dizem isso, disse Maria Espinola, psicóloga e professora assistente da Faculdade de Medicina da Universidade de Cincinnati.
Com pacientes deprimidos, disse o Dr. Espinola, “sua fala é geralmente mais monótona, plana e suave. Eles também têm uma faixa de afinação reduzida e volume mais baixo. Eles fazem mais pausas. Eles param com mais frequência.”
Pacientes com ansiedade sentem mais tensão em seus corpos, o que também pode mudar a forma como sua voz soa, disse ela. “Eles tendem a falar mais rápido. Eles têm mais dificuldade em respirar.”
Hoje, esses tipos de recursos vocais estão sendo aproveitados por pesquisadores de aprendizado de máquina para prever depressão e ansiedade, bem como outras doenças mentais, como esquizofrenia e transtorno de estresse pós-traumático. O uso de algoritmos de aprendizado profundo pode descobrir padrões e características adicionais, conforme capturados em gravações de voz curtas, que podem não ser evidentes mesmo para especialistas treinados.
“A tecnologia que estamos usando agora pode extrair características que podem ser significativas que nem mesmo o ouvido humano consegue captar”, disse Kate Bentley, professora assistente da Harvard Medical School e psicóloga clínica do Massachusetts General Hospital.
“Há muita empolgação em encontrar indicadores biológicos ou mais objetivos de diagnósticos psiquiátricos que vão além das formas mais subjetivas de avaliação que são tradicionalmente usadas, como entrevistas avaliadas por médicos ou medidas de auto-relato”, disse ela. Outras pistas que os pesquisadores estão rastreando incluem mudanças nos níveis de atividade, padrões de sono e dados de mídia social.
Esses avanços tecnológicos ocorrem em um momento em que a necessidade de cuidados de saúde mental é particularmente aguda: de acordo com um relatório da National Alliance on Mental Illness, um em cada cinco adultos nos Estados Unidos sofreram doença mental em 2020. E os números continuam a subir.
Embora a tecnologia de IA não possa lidar com a escassez de profissionais de saúde mental qualificados – não há o suficiente para atender às necessidades do país, disse o Dr. Bentley – há esperança de que ela possa diminuir as barreiras para receber um diagnóstico correto, ajudar os médicos a identificar pacientes que podem hesitar em procurar atendimento e facilitar o automonitoramento entre as visitas.
“Muita coisa pode acontecer entre as consultas, e a tecnologia pode realmente nos oferecer o potencial de melhorar o monitoramento e a avaliação de forma mais contínua”, disse o Dr. Bentley.
Para testar essa nova tecnologia, comecei baixando o Aplicativo de condicionamento físico da Sonde Health, uma empresa de tecnologia em saúde, para ver se meus sentimentos de mal-estar eram um sinal de algo sério ou se eu estava simplesmente definhando. Descrito como “um produto de registro e rastreamento de condicionamento mental por voz”, o aplicativo gratuito me convidou a registrar meu primeiro check-in, uma entrada de diário verbal de 30 segundos, que classificaria minha saúde mental em uma escala de 1 a 100.
Um minuto depois eu tinha minha pontuação: não muito bom 52. “Preste atenção” o aplicativo avisou.
O aplicativo sinalizou que o nível de vivacidade detectado na minha voz estava notavelmente baixo. Eu soava monótono simplesmente porque estava tentando falar baixinho? Devo seguir as sugestões do aplicativo para melhorar minha aptidão mental, indo dar um passeio ou organizando meu espaço? (A primeira pergunta pode indicar uma das possíveis falhas do aplicativo: como consumidor, pode ser difícil saber Por quê seus níveis vocais flutuam.)
Mais tarde, sentindo-me nervoso entre as entrevistas, testei outro programa de análise de voz, este focado em detectar níveis de ansiedade. O Teste de ondas de estresse é uma ferramenta online gratuita da Cigna, o conglomerado de saúde e seguros, desenvolvida em colaboração com o especialista em IA Ellipsis Health para avaliar os níveis de estresse usando amostras de 60 segundos de fala gravada.
“O que te mantém acordado à noite?” foi o prompt do site. Depois de passar um minuto relatando minhas preocupações persistentes, o programa marcou minha gravação e me enviou um pronunciamento por e-mail: “Seu nível de estresse é moderado”. Ao contrário do aplicativo Sonde, o e-mail de Cigna não ofereceu dicas úteis de auto-aperfeiçoamento.
Outras tecnologias adicionam uma camada potencialmente útil de interação humana, como Kintsugi, uma empresa com sede em Berkeley, Califórnia, que levantou US$ 20 milhões em financiamento da Série A no início deste mês. Kintsugi é nomeado para a prática japonesa de consertando cerâmica quebrada com veios de ouro.
Fundada por Grace Chang e Rima Seiilova-Olson, que se uniram pela experiência compartilhada de lutar para acessar cuidados de saúde mental, a Kintsugi desenvolve tecnologia para provedores de telessaúde e call center que podem ajudá-los a identificar pacientes que podem se beneficiar de mais apoio.
Ao usar o programa de análise de voz de Kintsugi, uma enfermeira pode ser solicitada, por exemplo, a tirar um minuto extra para perguntar a um pai atormentado com uma criança com cólica sobre seu próprio bem-estar.
Uma preocupação com o desenvolvimento desses tipos de tecnologias de aprendizado de máquina é a questão do viés – garantir que os programas funcionem de forma equitativa para todos os pacientes, independentemente de idade, sexo, etnia, nacionalidade e outros critérios demográficos.
“Para que os modelos de aprendizado de máquina funcionem bem, você realmente precisa ter um conjunto de dados muito grande, diversificado e robusto”, disse Chang, observando que Kintsugi usou gravações de voz de todo o mundo, em muitos idiomas diferentes, para se proteger contra este problema em particular.
Outra grande preocupação neste campo nascente é a privacidade – particularmente dados de voz, que podem ser usados para identificar indivíduos, disse o Dr. Bentley.
E mesmo quando os pacientes concordam em ser registrados, a questão do consentimento às vezes é dupla. Além de avaliar a saúde mental de um paciente, alguns programas de análise de voz usam as gravações para desenvolver e refinar seus próprios algoritmos.
Outro desafio, disse Bentley, é a desconfiança potencial dos consumidores em relação ao aprendizado de máquina e aos chamados algoritmos de caixa preta, que funcionam de maneiras que nem os próprios desenvolvedores podem explicar completamente, particularmente quais recursos eles usam para fazer previsões.
“Existe a criação do algoritmo e a compreensão do algoritmo”, disse o Dr. Alexander S. Young, diretor interino do Instituto Semel de Neurociência e Comportamento Humano e presidente de psiquiatria da Universidade da Califórnia, em Los Angeles, ecoando as preocupações que muitos pesquisadores têm sobre IA e aprendizado de máquina em geral: que pouca ou nenhuma supervisão humana está presente durante a fase de treinamento do programa.
Por enquanto, o Dr. Young permanece cautelosamente otimista sobre o potencial das tecnologias de análise de voz, especialmente como ferramentas para os pacientes monitorarem a si mesmos.
“Eu acredito que você pode modelar o estado de saúde mental das pessoas ou aproximar seu estado de saúde mental de uma maneira geral”, disse ele. “As pessoas gostam de poder automonitorar seus status, principalmente com doenças crônicas.”
Mas antes que as tecnologias automatizadas de análise de voz entrem em uso geral, algumas estão exigindo investigações rigorosas de sua precisão.
“Nós realmente precisamos de mais validação não apenas da tecnologia de voz, mas também de modelos de IA e aprendizado de máquina construídos em outros fluxos de dados”, disse o Dr. Bentley. “E precisamos obter essa validação a partir de estudos representativos em larga escala e bem projetados.”
Até então, a tecnologia de análise de voz orientada por IA continua sendo uma ferramenta promissora, mas não comprovada, que pode eventualmente ser um método diário para medir a temperatura do nosso bem-estar mental.
Discussão sobre isso post