Es posible que hayas visto un video del rostro de Nicholas Cage transpuesto a otro personaje haciendo el recorridos por internet recientemente. No, no estamos hablando de un clip de la película Face / Off. Estas son escenas de varias películas en las que Nicholas Cage ciertamente no protagonizó, pero se ven realmente muy convincentes. ¿Cómo lo hicieron?
Bueno, la respuesta no es «brujería» sino tecnología que ha sido apodada «deepfake» y está causando un gran revuelo en varias industrias y comunidades.
¿Qué es un «Deepfake»?
La palabra «deepfake» proviene del término «aprendizaje profundo» y, por supuesto, «falso». El aprendizaje profundo es una rama especializada del aprendizaje automático, que nuevamente forma parte del campo global de la inteligencia artificial.
Con el espectacular aumento de la potencia informática y las formas recientemente descubiertas para que las computadoras procesen y analicen cantidades masivas de datos del mundo real, las computadoras ahora pueden hacer de repente cosas que la mayoría de nosotros no podemos imaginar. Deepfakes aplica esta tecnología para sintetizar imágenes humanas, creando fotos o videos de cosas que estas personas nunca hicieron y nunca dijeron.
¡Mira también nuestro video de YouTube!
¿Cómo funciona la tecnología Deepfake?
El aprendizaje profundo, que subyace a los métodos deepfake, describe la aplicación moderna de la simulación de redes neuronales a conjuntos de datos masivos. Las redes neuronales no son un concepto nuevo ni una tecnología nueva, pero hasta hoy eran bastante rudimentarias.
Una red neuronal artificial simula el proceso de aprendizaje que ocurre en los cerebros biológicos, al menos hasta cierto punto. A medida que aprende o se enfrenta al mundo exterior, las conexiones entre las células cerebrales cambian.
Forman circuitos y estructuras lógicas, fortaleciendo algunas conexiones y debilitando otras. Cuando dominas algo, como aprender a conducir o jugar al tenis, estos circuitos cerebrales se vuelven rápidos y eficientes. En última instancia, eres tan bueno en algo que ni siquiera tienes que pensar en hacerlo.
Esencialmente sucede lo mismo con un sistema de aprendizaje profundo. Mira muchos ejemplos de algo y gradualmente mejora su «comprensión».
En el caso de los deepfakes, el software examina ejemplos de la cara que desea transponer, así como el video al que desea transponerlo. Con suficiente entrenamiento, opcionalmente puede sintetizar un rostro que coincida con los datos de entrenamiento y luego superponerlo sin problemas en cualquier otro rostro.
¿Qué software se utiliza para crear Deepfakes?
Hay una serie de aplicaciones que permiten a las personas crear deepfakes. FakeApp fue la primera aplicación que conocemos destinada a brindar a las personas normales la oportunidad de crear contenido deepfake. El sitio web ya no está y encontrar una copia no es nada fácil.
Los creadores de deepfakes ahora han cambiado en gran medida a una aplicación llamada DeepFaceLab, que está alojado en GitHub y ha generado un flujo interminable de tutoriales de lugares como Reddit.
Hacer un deepfake
Este artículo no pretende ser un tutorial, por lo que le daremos una descripción general de cómo se hacen las deepfakes en la práctica, pero no los pasos exactos para hacer uno usted mismo.
Hay varias razones para esto, pero la principal es que la legalidad de hacer deepfakes es muy controvertida. Así como no proporcionamos los pasos exactos para ayudarlo a piratear software o realizar otras actividades ilegales, no daremos instrucciones paso a paso sobre cómo crear deepfakes.
Además, el actual creador de DeepFaceLab ha publicado un video tutorial paso a paso para software que cualquiera pueda seguir, si quiere asumir la responsabilidad de tal riesgo.
Para tener una idea de la calidad de este material, Visite este sitio web donde se genera una nueva fotografía de una persona que no existe al actualizar la página.
Nuestro objetivo es ayudarlo a comprender la tecnología, ya que la encontrará cada vez más con el tiempo. Dicho esto, estos son los pasos principales para crear un deepfake con DeepFaceLab.
Después de descargar y descomprimir DeepFaceLab, se encuentra con una carpeta que contiene muchas otras carpetas y una serie de archivos por lotes.
Hay una carpeta llamada «espacio de trabajo» que contiene plantillas de formación, vídeos de origen y resultados. DeepFaceLab trabaja con ubicaciones y nombres de archivo específicos, por lo que los archivos por lotes pueden funcionar. Por ejemplo, el archivo de origen siempre se llama «data_src» y el destino se llama «data_dst».
No hay una interfaz de software como la mayoría de la gente sabe. Solo una lista de archivos por lotes numerados que representan los pasos del proceso. Primero, las imágenes de origen y destino de los videos se extraen como archivos de imagen.
Luego, se realizan varios pasos de análisis, seguidos de un entrenamiento basado en GPU, donde la red neuronal aprende lo que necesita sobre las caras en los dos videos para construir un modelo. Finalmente se produce un nuevo video compuesto.
Mal uso de Deepfakes
Como mencionamos anteriormente, los deepfakes son muy controvertidos. Puede violar las leyes existentes en algunos países y se están desarrollando nuevas leyes para hacer frente a la tecnología y sus aplicaciones.
Los deepfakes se pueden utilizar para crear engaños, como video de un presidente diciendo cosas locas. Puede usarse para insertar a personas en películas pornográficas con el propósito de acosarlas o dañarlas de alguna otra manera.
Como probablemente puedas imaginar, podrías hacer mucho daño con un deepfake convincente y las consecuencias si te atrapan pueden volverse mucho más serias en un futuro cercano.
Cuestionar todo
Ahora que esta tecnología existe y funciona tan bien como lo hace, eso significa que debemos ver los medios como los videos desde una perspectiva completamente nueva. Si alguien está circulando un video en las redes sociales de una persona famosa o un político que dice o hace algo controvertido, primero deberá preguntar si el video es real.
La mayoría de los deepfakes mal hechos son obviamente falsificaciones, una vez que sabes qué buscar y has visto algunos. Sin embargo, en algunos casos, incluso un ojo perspicaz puede tener dificultades para decir que se está produciendo algún tipo de manipulación CG y, a medida que la tecnología mejore, finalmente se volverá imposible.