Se você já ligou para um número 800 para perguntar ou reclamar de algo que comprou ou para fazer uma consulta sobre algo que está pensando em comprar, há uma boa chance de você ter obtido um perfil – pelo arranjo de suas palavras e o tom de sua voz – sem saber. Minha pesquisa sugere que muitos centros de atendimento ao cliente agora abordam e gerenciam os chamadores com base no que eles pensam a voz da pessoa ou sintaxe revelar sobre as emoções, sentimentos e personalidade do indivíduo, muitas vezes em tempo real.
As empresas dedicadas à venda personalizada – incluindo algumas marcas favoritas de nome – também estão se preparando para vincular o que suas cordas vocais supostamente revelam sobre seu estado emocional a informações demográficas, psicográficas e comportamentais mais tradicionais.
Se durante uma chamada com um agente de cliente esta tecnologia biométrica marcar você como “tenso”, pode ser oferecido um desconto na compra, especialmente se os registros da empresa também indicarem que você gasta muito. Ser identificado como um certo tipo também pode levar você encaminhado para um representante de atendimento ao cliente quem a empresa acredita que funciona melhor com sua personalidade presumida: talvez “lógico e responsável ”ou“ criativo e lúdico ”, duas dessas categorias.
Os executivos da empresa afirmam que estão cumprindo sua responsabilidade de alertar os chamadores sobre essas análises de voz, introduzindo nas interações de atendimento ao cliente uma frase ambígua, como: “Esta ligação pode ser gravada para fins de treinamento e controle de qualidade”. Mas essa frase legal é evidência de uma ameaça crescente que pode transformar nossas próprias vozes em ferramentas insidiosas para o lucro corporativo.
Não se trata apenas de call centers. Dispositivos como alto-falantes inteligentes e smartphones agora capturam nossas palavras e o timbre de nossas vozes.
Rohit Prasad, cientista chefe Alexa da Amazon, disse à publicação online de tecnologia OneZero que “quando ela reconhecer que você está frustrado com ela, Alexa pode agora tentar se ajustar, assim como você ou eu faríamos”.
Logo as empresas também podem tirar conclusões sobre seu peso, altura, idade, etnia e muito mais – todas as características que alguns cientistas acreditam que são revelados pela voz humana.
Amazon e Google, as forças de maior visibilidade em vigilância por voz hoje, ainda não estão usando o potencial máximo dessas ferramentas, aparentemente porque estão preocupados em inflamar medos sociais. A tecnologia é baseada na ideia de que a voz é biométrica – uma parte do corpo que pode ser usada para nos identificar e avaliar instantaneamente e permanentemente. As empresas que usam essa tecnologia de voz para nos oferecer melhores preços soam muito bem, a menos que você esteja no campo que perde o desconto. E se o seguro for recusado ou você tiver que pagar muito mais por ele? E se você for rejeitado durante as primeiras exibições de emprego ou se seus gostos culturais forem prejudicados enquanto você navega na Internet?
Em 12 de janeiro, o Spotify recebeu um patente extraordinária que reivindica a capacidade de apontar o estado emocional, sexo, idade, sotaque e “inúmeras outras caracterizações” de um indivíduo, com o objetivo de recomendar a música com base na sua análise desses fatores. Em maio, uma coalizão de mais de 180 músicos, organizações de direitos humanos e indivíduos interessados enviou uma carta ao Spotify exigindo que nunca use ou monetize a patente. O Spotify afirma que “não tem planos” para fazer isso, mas a coalizão quer uma rejeição mais forte.
Assinei essa carta, mas também estou ciente de que a patente do Spotify é apenas um pequeno afloramento na indústria emergente de inteligência de voz. Uma das reivindicações de patentes do Google ele pode analisar os padrões de movimento doméstico por meio de microfones especiais colocados em toda a casa e identificar qual residente está em qual cômodo.
Com base em assinaturas de voz, os circuitos patenteados do Google inferem gênero e idade. Um pai pode programar o sistema para ligar ou desligar dispositivos eletrônicos como uma forma de controlar as atividades dos filhos. Amazon já afirma que é Pulseira Halo é capaz de identificar seu estado emocional durante suas conversas com outras pessoas. (A empresa garante aos proprietários do dispositivo que não pode usar essas informações). Muitos hotéis adicionaram dispositivos Amazon ou Google em seus quartos. As empresas de construção estão construindo Alexa da Amazon e o Assistente do Google nas paredes de novas casas.
Grandes anunciantes e agências de publicidade já estão se preparando para um futuro não muito distante quando extrair valor competitivo de formas mais antigas de dados de público (dados demográficos, psicográficos, comportamento na internet), como um executivo de negócios me disse, “começará a estagnar”. Eles também recorrerão ao perfil de voz “para criar valor”.
Os executivos de publicidade que entrevistei também expressaram aborrecimento com o fato de a Amazon e o Google não permitirem que analisem as palavras ou vozes das pessoas que falam para os aplicativos das empresas nos alto-falantes inteligentes Echo e Nest. Alguns anunciantes, sem provas concretas, temem que a Amazon e o Google estejam se apropriando das impressões de voz para uso próprio. Essas preocupações levaram os anunciantes a começar a explorar suas próprias maneiras de explorar as assinaturas de voz dos clientes.
Todos esses jogadores reconhecem que podemos estar entrando na era da voz em primeiro lugar, onde as pessoas vão falar suas instruções e pensamentos para seus companheiros digitais, em vez de digitá-los.
Por causa dos recentes avanços importantes no processamento de linguagem natural e aprendizado de máquina, os indivíduos em breve serão capazes de falar coloquialmente não apenas com seu assistente de telefone ou alto-falante inteligente, mas com seu assistente de banco dedicado, equipamento de cozinha, menu de restaurante, console de quarto de hotel, dever de casa, ou carro.
De certa forma, muito disso parece incrivelmente legal – como se finalmente estivéssemos chegando à idade dos Jetsons. Esses desenvolvimentos impressionantes soam ainda mais emocionantes quando alguns médicos e empresas de saúde argumentam que os sons de uma pessoa podem trair doenças como Alzheimer e Parkinson. Mas essas tecnologias também são preocupantes porque nos envolvemos em uma ladeira escorregadia sempre que começamos a permitir que os sons de nossa voz e a sintaxe de nossas palavras personalizem anúncios e ofertas com base em fins lucrativos.
A VICE relatou que o diretor de tecnologia da Cerence disse aos investidores, “O que estamos procurando é compartilhar esses dados de volta com” fabricantes de automóveis e, em seguida, “ajudá-los a monetizá-los”.
Pode parecer um pequeno preço a pagar até que você projete o uso dessa tecnologia em um futuro próximo. O balconista de uma loja de roupas usa uma análise de sua voz para determinar a probabilidade de você vender certas roupas. Você liga para um restaurante chique para fazer uma reserva, mas seu sistema de análise de voz conclui que você não atende à definição de um restaurante aceitável e é recusado. Uma escola nega a inscrição de um aluno em um curso especial depois que a análise de voz determina que o aluno não foi sincero sobre seu interesse nele.
Como esse futuro se materializaria? Tudo começa com os usuários dando permissão às empresas.
Em nosso país hoje, apenas alguns estados têm leis de privacidade biométrica que exigem que uma empresa obtenha o consentimento explícito dos usuários. A União Europeia, no entanto, exige consentimento opt-in, e é provável que mais estados acabem por adotar leis comparáveis. Em sua política de privacidade, o aplicativo social TikTok reivindicou o direito de coletar impressões de voz dos usuários por razões bastante vagas, mas a partir de junho também observou que apenas “quando exigido por lei, buscaremos quaisquer permissões necessárias de você antes de qualquer coleta”.
Essas leis não vão longe o suficiente para impedir o perfil de voz. As empresas obterão a aprovação dos clientes promovendo o valor sedutor das tecnologias de voz em primeiro lugar, explorando as tendências de formação de hábitos das pessoas e evitando explicar como a análise de voz realmente funciona.
Muitas pessoas não tendem a pensar em humanóides de boa aparência como ameaçadores ou discriminatórios, mas podem ser as duas coisas. Estamos em um novo mundo da biometria e precisamos estar cientes dos perigos que ela pode trazer – ao ponto de proibir seu uso em marketing.
Joseph Turow é professor de sistemas de mídia e indústrias na Universidade da Pensilvânia. Ele é o autor de “The Voice Catchers: How Marketers Listen in to Exploit Your Feelings, Your Privacy, and Your Wallet”.
The Times está empenhado em publicar uma diversidade de letras para o editor. Gostaríamos de ouvir sua opinião sobre este ou qualquer um de nossos artigos. Aqui estão alguns pontas. E aqui está nosso e-mail: [email protected].
Siga a seção de opinião do The New York Times sobre Facebook, Twitter (@NYTopinion) e Instagram.
Discussão sobre isso post