Em entrevista ao IT Section, Brunno Santos, General Manager da ElevenLabs, explica por que o Brasil é um mercado-chave para a empresa, como a atuação local vai impactar o desenvolvimento de soluções de voz por IA e quais transformações os usuários e empresas podem esperar em atendimento, educação, saúde e acessibilidade. Ele também aborda desafios de segurança, ética e confiabilidade da tecnologia, destacando o compromisso da ElevenLabs com inovação responsável e experiências personalizadas para o público brasileiro.
IT Section: Por que o Brasil é estratégico para a ElevenLabs e como a presença local vai impactar o desenvolvimento de soluções de voz por IA?
Brunno Santos: O Brasil é um mercado-chave na estratégia global da ElevenLabs, tanto pelo tamanho quanto pela velocidade de adoção de tecnologias baseadas em voz. O país já figura entre os dez maiores mercados da empresa em volume de uso, está no top três em visitas ao site global e no top cinco em número de assinantes — dados que refletem uma comunidade altamente engajada e aberta à inovação. Com presença local, a ElevenLabs poderá converter esse engajamento em impacto direto no desenvolvimento de soluções de voz por IA, fortalecendo o movimento de transformação voice-first na América Latina. A atuação no país permitirá adaptar nossos agentes conversacionais às necessidades das empresas brasileiras, conectando-os a sistemas corporativos, bancos de dados e fluxos de atendimento. Além disso, a infraestrutura global de baixa latência e alto desempenho garante experiências em tempo real, seguras e escaláveis, essenciais para clientes enterprise. A personalização das vozes e personalidades — ajustadas a sotaques, entonações e preferências locais — também reforça nosso compromisso com uma experiência natural e relevante para o público brasileiro.
IT Section: Qual é o limite atual da tecnologia de voz por IA e onde ela ainda precisa evoluir?
Brunno Santos: A tecnologia de voz por IA atingiu um grau notável de naturalidade, expressividade e contextualização. Hoje, agentes desenvolvidos com base na tecnologia da ElevenLabs já são capazes de compreender intenções, realizar ações e interagir em múltiplos idiomas com fluidez e empatia, o que abre espaço para aplicações corporativas de alto impacto. Nossos agentes podem ser integrados a CRMs, bases de conhecimento e sistemas internos, respondendo em tempo real com informações precisas e alinhadas ao contexto de negócio. Ainda assim, a evolução da tecnologia passa por desafios importantes, como o aprimoramento da adaptação cultural e linguística e o fortalecimento das práticas de segurança e ética. Refletimos esse compromisso com a inovação responsável, detalhando princípios de rastreabilidade, transparência e colaboração contínua. Buscamos garantir que a IA de voz continue evoluindo de forma confiável, segura e humanizada.
Ainda assim, os desafios de segurança, ética e confiança permanecem centrais. A ElevenLabs adota o princípio de Safety by Design, integrando camadas de proteção desde o desenvolvimento das soluções. Isso inclui mecanismos para prevenir usos indevidos, restrições a vozes de alto risco e verificações de identidade para clonagem de voz. Outro pilar fundamental é a rastreabilidade: os sistemas são estruturados para vincular o conteúdo gerado ao usuário responsável, preservando a privacidade de quem utiliza a tecnologia de forma legítima. A transparência também é essencial — buscamos garantir que as pessoas saibam quando estão interagindo com IA e qual é a origem do conteúdo. A evolução da IA de voz, portanto, passa por consolidar esse equilíbrio entre inovação e responsabilidade.
IT Section: Entre os setores prioritários no Brasil, qual terá a transformação mais disruptiva com IA de voz e por quê?
Brunno Santos: Setores como atendimento ao cliente, telecomunicações, finanças, mídia e saúde devem experimentar transformações profundas com a incorporação da IA de voz. A tecnologia de agentes conversacionais permite que empresas criem assistentes inteligentes capazes de compreender linguagem natural, acessar dados de sistemas corporativos e realizar tarefas complexas de forma automática. Isso significa que um agente pode responder a perguntas, consultar informações, agendar serviços e resolver demandas sem necessidade de intervenção humana, reduzindo custos e aumentando a eficiência. No setor financeiro, por exemplo, agentes podem oferecer suporte em tempo real com alto grau de segurança e conformidade. Na saúde, podem auxiliar em triagens, lembretes e acessibilidade. Já em mídia e educação, ampliam o alcance de conteúdo e tornam experiências digitais mais inclusivas. Essa transformação é impulsionada por um público brasileiro que já se comunica naturalmente por voz e valoriza interações instantâneas, personalizadas e humanas.
IT Section: Como a ElevenLabs pretende estimular a inovação local e atrair desenvolvedores brasileiros?
Brunno Santos: A formação e o engajamento de talentos são centrais na estratégia da ElevenLabs no Brasil. Queremos fortalecer o ecossistema local ao disponibilizar as mesmas ferramentas de criação de agentes conversacionais que hoje impulsionam grandes empresas globais. Desenvolvedores brasileiros terão acesso a APIs, SDKs e plataformas que permitem criar e treinar agentes de voz personalizados, conectados a fluxos corporativos e otimizados para o idioma e o contexto local. Além disso, programas como o Impact Program e o ElevenLabs Grants oferecem acesso gratuito a recursos da plataforma para startups, criadores independentes e projetos voltados à acessibilidade e à educação. Essas iniciativas estimulam a experimentação e a inovação prática, formando uma nova geração de profissionais especializados em IA de voz. Ao combinar tecnologia, capacitação e propósito, a ElevenLabs pretende transformar o Brasil em um polo de inovação em voz e áudio inteligente.
IT Section: Como equilibrar inovação e ética em um setor que pode gerar áudios falsos ou manipulados?
Brunno Santos: Equilibrar inovação e ética no setor de IA de voz é fundamental, especialmente diante do risco de áudios falsos ou manipulados. Na ElevenLabs, todas as soluções são desenvolvidas sob a filosofia de Safety by Design, com camadas de segurança técnica e política incorporadas desde a concepção. Nossa infraestrutura inclui criptografia de ponta, sistemas de moderação ativa e o modo de “zero retention”, que impede o armazenamento de dados de usuários. Também desenvolvemos um dos classificadores de voz mais precisos do mercado, capaz de identificar conteúdos gerados por IA com 99% de acurácia, além de mecanismos de bloqueio para impedir o uso de vozes de alto risco sem consentimento. O compromisso ético se estende à transparência — garantindo que usuários saibam quando interagem com IA — e à rastreabilidade de conteúdo, que permite verificar a origem e o uso de vozes geradas artificialmente. Esses esforços refletem a convicção de que só é possível escalar a IA de voz globalmente com confiança, segurança e responsabilidade compartilhada.
IT Section: Que mudanças concretas os usuários brasileiros podem esperar na forma de consumir serviços digitais com voz por IA?
Brunno Santos: Os usuários brasileiros vão notar transformações visíveis na maneira de interagir com serviços digitais à base de voz. Primeiro, agentes de voz e texto estarão disponíveis em vários idiomas, inclusive com detecção automática, o que significa que será possível conversar em português ou alternar de idioma sem ajustes manuais. Esses agentes atuarão de forma mais integrada aos sistemas já existentes pelas empresas — CRM, bases de conhecimento, sistemas de atendimento e calendários — permitindo que as respostas sejam mais informadas, contextualizadas e precisas. Outra mudança concreta é a redução de atrasos ou pausas incômodas: a IA conversacional da ElevenLabs opera com latência muito baixa, o que torna as interações mais naturais, semelhantes a uma conversa humana, seja em chamadas telefônicas, assistentes por voz ou agentes integrados a aplicativos. Também haverá maior confiabilidade no serviço, inclusive em chamadas de voz bidirecionais (recebidas ou feitas), automações de chamadas externas (outbound), e integração com infraestruturas de telefonia corporativa.
Além disso, será mais fácil para empresas e criadores de conteúdo oferecer experiências personalizadas: vozes customizadas, personalidades de agente adaptadas à marca, agentes que compreendem as necessidades do contexto do usuário (como histórico, documentos ou FAQ internos) e interações em diferentes modos — só voz, só texto, ou voz + texto — dependendo da interface ou do canal. Finalmente, para o usuário comum, isso vai se traduzir em suporte 24/7 mais eficiente, menos espera ou transferência entre atendentes humanos, serviços digitais (atendimento, educação, comércio, saúde, entre outros) que respondem de modo mais conversacional, mais natural e acessível. Também haverá maior transparência sobre quando uma interação está sendo mediada por IA, garantindo segurança e privacidade no uso de dados pessoais.
IT Section: Como a IA de voz pode promover acessibilidade, inclusão e impacto social no Brasil?
Brunno Santos: A IA de voz tem um enorme potencial para promover acessibilidade, inclusão e impacto social, reduzindo barreiras de comunicação, tornando conteúdos educativos e culturais mais acessíveis e criando novas formas de interação para pessoas com deficiência ou dificuldades de fala. Programas globais de impacto social têm demonstrado como licenças gratuitas e ferramentas de IA de voz podem apoiar organizações sem fins lucrativos, edtechs e iniciativas de inclusão, oferecendo vozes personalizáveis, realistas e adaptadas a diferentes idiomas e contextos.
No campo da educação, tutores em voz gerados por IA podem personalizar o ensino, adaptando-se ao ritmo de cada aluno e ampliando o alcance do aprendizado digital, inclusive em ambientes multilíngues. Na área da saúde e acessibilidade, a tecnologia permite a clonagem de voz para preservar a identidade vocal de pessoas com perda de fala, além de criar soluções para diferentes condições cognitivas e barreiras de comunicação. Com foco em multilinguagem e escalabilidade, a IA de voz pode tornar experiências digitais mais inclusivas e acessíveis em todo o país, ajudando a construir um ambiente em que educação, cultura e serviços essenciais estejam disponíveis para todos, considerando as diversas necessidades físicas, cognitivas ou linguísticas da população.













