IA clona o rosto de qualquer pessoa na webcam
Ferramenta só precisa de uma foto, e gera resultados convincentes; tecnologia pode ter consequências sociais devastadoras no futuro
A ferramenta se chama Deep-Live-Cam e foi desenvolvida pelo programador Kenneth Estanislao, que a liberou para download no GitHub (o repositório de código mais usado pelos desenvolvedores de software). Ela promete clonar o rosto de qualquer pessoa na webcam – bastando, para isso, alimentar o programa com uma foto dela. Feito isso, o usuário pode fazer videochamadas ou gravar vídeos se passando por quem desejar.
O programa mapeia as expressões faciais de quem está falando e as reproduz, em tempo real, no rosto clonado. O resultado (como você pode ver no clipe abaixo, em que o Deep-Live-Cam foi usado para clonar os rostos de celebridades como Mark Zuckerberg, George Clooney e Hugh Grant), é surpreendente.
A única imperfeição visível está no cabelo, que o software não simula bem (o modelo usa um topete que as pessoas clonadas não têm). Tirando isso, o resultado é real e natural o suficiente para enganar a maioria das pessoas.
Some experiments – it works almost flawlessly and it’s totally real-time. Took me 5 minutes to install. pic.twitter.com/Ow0QRF7WOj
— joao (@jay_wooow) August 9, 2024
O Deep-Live-Cam usa dois algoritmos de IA, chamados GFPGAN e inswapper, para mapear o rosto da vítima (a partir da foto) e do farsante. Já existiam outras ferramentas do tipo, mas o software é o primeiro relativamente fácil de usar: basta fazer o download dele, e de alguns outros componentes, e instalar no computador.
Há dois poréns. O primeiro é que o Deep-Live-Cam exige uma placa de vídeo muito potente, e mesmo assim pode engasgar – pois os algoritmos de IA rodam em tempo real. Há relatos de usuários que, mesmo usando uma RTX 4090, da Nvidia (que é a placa mais rápida do mercado, alcançando incríveis 82 teraflops, quase oito vezes o poder gráfico de um PlayStation 5), não conseguiram manter a clonagem em 30 fps estáveis.
Isso serve como uma barreira de entrada, retardando a popularização do software. O outro “defeito” é que ele não clona a voz – o que, dependendo da pessoa que está sendo simulada, pode comprometer a encenação.
O criador do Deep-Live-Cam afirma que o objetivo do software é ser “ajudar artistas em tarefas como a animação de personagens”, e seu desenvolvimento “adere à lei e à ética”. Mas reconhece o perigo social envolvido – afirmando que poderá “encerrar o projeto ou adicionar marcas d’água [às imagens, o que revelaria o uso de IA] caso isso seja legalmente requerido”.
Em fevereiro, uma empresa de Hong Kong perdeu US$ 25 milhões num golpe online em que farsantes usaram IA para clonar o rosto do diretor financeiro da companhia – ele entrou numa videoconferência e mandou os colegas fazerem transferências bancárias para os golpistas.