Ferramenta de inteligência artificial pode clonar voz a partir de áudios com 15 segundos

Nesta sexta (29), a OpenAI, responsável pelo desenvolvimento do ChatGPT, revelou nesta sexta-feira (29) os resultados iniciais de um teste para uma funcionalidade de IA (inteligência artificial) generativa que tem a capacidade de pronunciar palavras com uma voz muito próxima à humana.
O Voice Engine possibilita ao usuário inserir um texto e obter uma amostra de áudio de 15 segundos com a informação sendo reproduzida na voz desejada.
“Estamos procedendo com cautela e de forma informada em relação a uma divulgação mais ampla, devido ao potencial de uso indevido da voz sintética. Com base nessas discussões e nos resultados desses testes em pequena escala, tomaremos uma decisão mais fundamentada sobre se e como implementar essa tecnologia em escala maior”, afirmou a empresa em uma declaração.
“Acreditamos que qualquer implementação em larga escala de tecnologia de voz sintética deve ser acompanhada por sistemas de autenticação de voz que verifiquem se o locutor original está conscientemente contribuindo com sua voz para o serviço e uma lista de vozes proibidas que identifique e impeça a criação de vozes muito semelhantes a figuras públicas proeminentes”.
A empresa dos Estados Unidos também destacou a precaução em lançar o Voice Engine durante o ano eleitoral no país. “Reconhecemos os sérios riscos associados à geração de falas que se assemelham às vozes de pessoas, especialmente durante um ano eleitoral”.