Deepfake: nem tudo é o que parece
PUBLICAÇÃO
sábado, 24 de outubro de 2020
Lara Bridi (estagiária)*
Talvez você já tenha visto (ou até mesmo experimentado) filtros de rosto em aplicativos: como mágica, você pode sumir com suas olheiras, usar óculos que você não tem ou até mesmo se tornar um cãozinho. A manipulação de vídeo é recurso existente há anos e tem se popularizado com os smartphones. Mas esses filtros se mostram simples com a chegada de outra ferramenta que tem gerado debate: o deepfake.
Em oposição aos filtros que produzem imagens escancaradamente falsas, o deepfake usa da Inteligência Artificial – ainda que não tão complexa quanto a presente no filme Matrix – para modificar vídeos e seus áudios de forma incrivelmente realista. Essa ferramenta permite que se mescle diferentes vídeos e imagens transformando ambos em um só. Assim, é possível fazer com que uma pessoa pronuncie algo que não havia dito, ou troque de corpo com outro indivíduo – o que a imaginação mandar.
Se o objetivo é satirizar uma figura pública, uma paródia bem-humorada pode dar conta do recado, como fez (ou fizeram) o proprietário do canal do YouTube ctrl shift face, que não se identifica nas redes sociais. Em um de seus vídeos, o presidente dos Estados Unidos, Donald Trump, é transformado em Saul Goodman, o advogado picareta da série Better Call Saul, simulando a imagem do político ensinando a lavar dinheiro.
“Mas e se os filmes de que gosto fossem interpretados por outros atores?” Essa deve ter sido a curiosidade do dono do canal EZRyderX47. O destaque de seus trabalhos é o vídeo em que substitui o rosto de Michael J. Fox em seu papel em De Volta Para o Futuro pelo do ator Tom Holland, o qual já ultrapassou a marca de um milhão de visualizações. O quebequense, também não identificado, aprendeu a usar o código em casa e hoje produz vídeos deepfake para o entretenimento.
A tecnologia tornou o processo de adulteração audiovisual menos trabalhoso do que costuma ser para a criação de efeitos especiais em um filme. Automaticamente, o algoritmo consegue identificar rostos em um vasto conjunto de imagens e entender como ele se comporta, tornando possível segmentá-lo quadro a quadro em um vídeo. Mas se engana quem pensa que hoje o recurso é familiar ou acessível para uso geral.
O doutor em Física Computacional e professor da UEL Sylvio Barbon Júnior conta que para utilizar o deepfake é necessário que seu usuário tenha conhecimentos do Deep Learning (ou “conhecimento profundo”, traduzido do inglês), conjunto de códigos que simulam a atuação dos neurônios em máquinas. O professor explica que em um computador programado para diferenciar objetos, por exemplo, um algoritmo mais simples exige que o ser humano explique cada passo em que a máquina vai agir para funcionar, mas “quando estamos trabalhando com Deep Learning, eu não explico mais nada. A minha rede é tão complexa, tão profunda e tão próxima ao cérebro humano que começa automaticamente a reconhecer diferenças.” – ilustra Barbon.
Por ser uma tecnologia tão complexa, também é preciso possuir uma máquina que consiga suportar o algoritmo. Computadores de última geração montados para jogar videogames portam placas gráficas (GPU) capazes de ler o software de jogos, mas também os códigos do Deep Learning.
Tanto essas máquinas quanto conhecimento necessário para operá-las tem um valor alto e por isso, o doutor conclui que “não é algo trivial pelo custo de máquina e pelo custo de base”, mas ressalta que, ao que tudo indica, os avanços caminham em direção a popularizar seu acesso. Nas palavras de Barbon, “a ideia é democratizar a Inteligência Artificial”.
Apesar de ser o computador a realizar o trabalho pesado, quem controla as faces e ações que serão combinadas ainda é o ser humano – e aí jaz o problema: e se o objetivo do usuário não for o entretenimento? Com a popularização desses processos, não se controla quem terá acesso ou não ao código. Perceba que os canais citados acima deixam claro que suas produções são manipuladas e não comprometem a imagem das personalidades presentes em vídeo – mas isso não é uma regra.
Especialistas se preocupam quanto a problemas éticos resultantes de sua utilização. O que tem sido observado é o uso do recurso para atribuir palavras e ações indevidamente a figuras públicas. Celebridades já se depararam com suas próprias imagens participando de filmes pornô que nunca gravaram. Vídeos falsos de figuras políticas pronunciando palavras que jamais saíram de suas bocas circularam nas redes sociais, fazendo com que internautas desavisados acreditassem em seus olhos. Nesses casos, o criador não indicou que a produção é deepfake, convencendo a muitos de que o vídeo é real. É argumentado que o fato representa perigo à democracia e à justiça, ao passo que se torna cada vez mais difícil de distinguir o real do virtual. Perece que naquilo em que o deepfake perde para a Matrix em complexidade, iguala-se em ameaça.
Para resguardar a si e seus usuários, muitas redes sociais consideraram banir conteúdos que incluam a ferramenta. Esse é o caso do Facebook, que esse ano anunciou que removerá qualquer publicação adulterada que não seja “aparente para uma pessoa comum” ou que “pareçam autênticos”.
Ainda que hoje a tecnologia não seja perfeita – apresenta muitos erros visuais que denunciam a não veracidade – é convincente. Porém, assim como seres humanos, essa tecnologia aprende com a prática e se aperfeiçoa com suas experiências. É o que cientistas como Barbon chamam de “treino”. Logo, o deepfake estará tão treinado que esses glitches se tornarão imperceptíveis. Aqueles que eram adeptos do “só acredito vendo” vão precisar deixar o lema para trás pois em breve, na internet, não será mais possível confiar apenas em seus sentidos.
***
- “Não podemos depositar todas as fichas nas soluções tecnológicas”
*Supervisão de Patrícia Maria Alves (editora)