Este ano, as tecnologias de voz deixaram de ser uma tendência a se observar, e passaram a demandar uma visão crítica dos executivos e um plano estratégico das marcas. Afinal, até 2024, o mundo terá 8.4 bilhões de assistentes de voz instalados em smartphones, computadores e outros milhares de dispositivos conectados, como geladeiras, carros e óculos inteligentes, movimentando cerca de US$ 80 bilhões por ano. Ficar de fora dessa grande transformação de paradigmas seria como abdicar do mouse nos anos 80 ou do touchscreen nos anos 2000.

As interfaces de voz crescem a passos largos desde 2017, e alimentam-se das grandes mudanças culturais provocadas pela pandemia. Em um mundo em que, pelo menos, 59% dos consumidores globais preferem utilizar interfaces de voz em locais públicos para reduzir o risco de contaminação, elas se tornaram ainda mais relevantes, como aponta a pesquisa “How to use Voice Tech during Covid-19”, de 2020.

A pandemia pode ter sido uma importante alavanca na adoção das interfaces de voz, mas não foi a única. Há tempos, a voz vem se tornando a forma mais integrada e intuitiva de realizar ações com o auxílio da Inteligência Artificial e da Internet das Coisas. Muito além dos comandos básicos no ambiente doméstico, as interfaces de voz abriram espaço para o uso comercial em escala, facilitando o dia a dia e as interações entre consumidores e marcas.

Um estudo conduzido pela consultoria Capgemini mostrou que, entre 2017 e 2019, em países da América do Norte e Europa, houve um aumento significativo no uso de assistentes de voz (entre os usuários ativos) para fins diversificados, incluindo comprade alimentos e produtos para a casa (um aumento de 35% para 53%), atendimento ao cliente e suporte pós-venda (um aumento de 37 % para 52%) e realização de pagamentos por produtos ou serviços (um aumento de 28% para 48%). 

Este comportamento reflete os avanços tecnológicos financiados, sobretudo, pelas seis maiores companhias globais de tecnologia (Microsoft, Google, Apple, Amazon, Facebook e Alibaba), que lideram esse mercado com uma ambição que vai muito além de um papel de destaque no ciclo de recuperação pós-covid. As tecnologias de voz estão prontas para se tornarem a principal interface entre humanos e máquinas, superando a Era do clique e do toque com conveniência e personalização.

Já é possível notar uma avalanche de iniciativas que vão do varejo e serviços, aos setores básicos da economia. Em 2021, você pode encontrar a pizzaria mais próxima usando o assistente de voz do seu smartphone, ou fazer o pedido da pizza da mesma forma. Boa parte dos bancos oferece consulta de saldo, transferências e pagamentos por voz. A escolha da programação da TV, a compra de filmes, o supermercado, produtos de beleza e até o agendamento do salão, podem ser feitos por meio de comandos falados. Você consegue criar seu próprio assistente inteligente com vozes, habilidades e palavras de alerta únicas, usando o recém-lançado produto da Amazon: Alexa Custom Assistant.

No semestre passado, criamos um microfilme para ilustrar a ascensão dos assistentes de voz – um conteúdo ideal para quem está chegando agora e precisa se colocar à par da novidade. Mas com a velocidade dos avanços e os novos projetos lançados desde então, decidi escrever esse artigo com algumas reflexões que nasceram de conversas com quem já entrou na trilha dessa inovação. Veja a seguir o que você precisa saber para sobreviver a um ano em que as tecnologias de voz serão decisivas para o marketing, vendas e relacionamento com clientes.

1. Mais do que um dispositivo inteligente, a voz representa uma nova interface. A diferença é que ela não será acionada eventualmente, e se tornará o pano de fundo de praticamente todas as interações de marca, principalmente (mas não somente), na experiência móvel. Para ilustrar essa grandeza, basta pensar que a voz deve assumir o lugar do clique e do toque como principal interface entre humanos e máquinas.

2. Os assistentes de voz já estão no dia a dia da maioria das pessoas. São os smartphones, e não os smart speakers, os grandes responsáveis pela popularização das tecnologias de voz. Apesar do crescimento de vendas do Google Nest, da Amazon Echo Dot e similares, nada se compara às vendas e a penetração de uso dos smartphones, que trazem assistentes de voz já embarcados. A ausência de fricção é um contexto inédito para adoção de novas tecnologias em escala: você não precisa comprar, baixar ou instalar algo para começar a usar e ser impactado pelos assistentes de voz no seu smartphone. São bilhões de dispositivos ready-to-go.

3. Reconhecimento de voz é a chave para a personalização. voice match foi o fator-chave para desbloquear ações mais relevantes com o uso da voz. Quando a tecnologia de reconhecimento de voz atingiu 95% de precisão, em 2017, um universo de novas perspectivas se abriu para o uso da voz. É por isso que em uma mesma residência, cada morador pode perguntar ao mesmo dispositivo sobre sua agenda e ele terá uma resposta personalizada. Isso serve para as transações bancárias, extremamente pessoais e sigilosas, e até para empresas que oferecem o reconhecimento de voz como desbloqueio de acessos.

4. Integrar antes, expandir depois. A princípio, a ação das marcas segue uma lógica de sincronização de bases já existentes, o que facilita iniciativas em uma interface de voz. Como primeiro passo, uma marca pode, simplesmente, transportar sua árvore de interações já existente no chat para uma interface de voz, por exemplo, ou atribuir às funcionalidades já existentes do seu app os respectivos comandos de voz. 

5. Invista na manutenção e aprendizagem constantes. As tecnologias por trás das interfaces de voz são basicamente: AI (Inteligência Artificial + Machine Learning), IoT (Internet das Coisas) e PLN (Processamento de Linguagem Natural). Por isso, uma interface de voz não pode ser considerada uma tecnologia ‘one-shot‘. A manutenção e o treinamento do algoritmo são tão importantes quanto o lançamento da ação. Um estudo de 2020, da Dimension Research, apontou que 78% das marcas que oferecem um serviço de voz, planejam atualizar seus sistemas de resposta com IA e processamento de linguagem natural nos próximos 12 meses. 

6. Considere a percepção de valor gerada. Criar uma interface de voz não é apenas uma vantagem tecnológica que otimiza a operação e qualifica a jornada de compra dos consumidores. Ela também influencia na percepção de valor sobre a marca e pode gerar um impacto positivo nos índices de satisfação da empresa, com um aumento de até 25pp nas notas do NPS (Net Promoter Score), como aponta a pesquisa “Conversational Commerce: Why Consumers Are Embracing Voice Assistants in Their Lives”.

7. Menos espaço para publicidade. As interações por voz podem ser apoiadas por uma tela, mas em geral não são. E mesmo as que trazem um complemento visual, não têm a mesma variedade de estímulos e opções que as interfaces tradicionais. A busca por texto, por exemplo, retorna ao menos 10 resultados orgânicos e 4 pagos, e continua oferecendo anúncios enquanto os usuários navegam pelo conteúdo dos sites. A voz traz uma resposta única, quase sempre de curta duração. Com menos espaços publicitários e, considerando que nem todas as interações por voz são pesquisas de produtos, os anunciantes vão precisar de estratégias que construam a presença de marca com a oferta de informação, se não quiserem arranhar sua verba de mídia. Uma pesquisa da Juniper Research indica que os gastos com publicidade nos assistentes de voz chegarão a quase US$ 19 bilhões até 2022. Quem construir autoridade agora, economizará depois.

8. Considere a voz no ambiente corporativo. Voz não é só para pessoa física. É para pessoa jurídica também. Enquanto Google e Amazon focam nas interações pessoais, a Microsoft (Cortana) trabalha em uma tecnologia dedicada exclusivamente às interações no ambiente corporativo. Além de facilitar operações em que o uso das mãos é limitado, as interfaces de voz auxiliam a tomada de decisões, tornando-as mais ágeis e assertivas, uma vez que consultam informações descentralizadas em tempo real.

9. A voz não é só a dos assistentes de voz. Embora os assistentes inteligentes sejam a ilustração mais popular das interfaces de voz, essa não é a única aplicação possível para a tecnologia. É fundamental pensar nas tecnologias de voz para além dos comandos básicos (Ex.: “apague as luzes”) e das perguntas rotineiras (Ex.: “vai chover amanhã?”). Um bom exercício para sair deste vício é pensar em empresas como a Descript, a Lyrebird ou a Resemble AI, que trabalham com emulação, clonagem e pós-edição de voz – uma atividade distinta, com aplicações distintas.

Outro grande exemplo é o sistema que está sendo desenvolvido por um grupo de pesquisadores da USP, que utiliza a Inteligência Artificial para reconhecer se um paciente enfrenta problemas respiratórios usando apenas a análise da voz. Se bem sucedida, a ferramenta poderá contribuir para a triagem de pacientes no sistema de saúde, inclusive, para os casos de covid-19.

Enquanto assimilamos essas reflexões básicas, o mercado se prepara para realizar três grandes movimentos em 2021:

  1. As interfaces por voz devem se consolidar primeiro nos ambientes da casa inteligente, nos smartphones e no setor automobilístico. Mas migrarão muito rapidamente para novos dispositivos e ambientes, e chegarão a áreas mais inesperadas, como agricultura e indústria de base;
  1. O caminho trilhado pelas empresas para absorver as tecnologias de voz passará pela fusão entre chat e voz, criando uma divisão de “interfaces conversacionais” dentro das empresas;
  1. A popularidade das interações por voz cresceu com o confinamento. À medida que as atividades forem retomadas nos locais de trabalho, espaços públicos e nos deslocamentos diários, as pessoas estarão pré-dispostas e levar o novo hábito para fora de casa, seja nos aplicativos ou outros dispositivos conectados.

Esse é o momento ideal para preparar sua empresa e treinar suas equipes para o assunto, pois, como costuma dizer Amir Hirsh, CEO da Audioburst, os assistentes virtuais são como gênios, eles nunca vão voltar para dentro da garrafa.

Rodrigo Carvalho é diretor de inovação da iD\TBWA