Secciones
Servicios
Destacamos
La manipulación de imágenes es una de las capacidades más llamativas de las nuevas herramientas de Inteligencia Artificial. ¿Cómo logran estas herramientas desnudar digitalmente a una treintena de chicas de Almendralejo, detener a Trump antes de que fuera arrestado o vestir al papa Francisco con ... una parca de moda entre los raperos?
Estas dos últimas fueron creadas con un programa llamado Midjourney -la primera, la de las menores de Badajoz se hizo con una aplicación para móvil-. Si ChatGTP trabaja con textos , Midjourney -y otros como Dall-e o Stable Diffusion- genera una imagen a partir de unas instrucciones que se llaman 'prompts'. «Es como desmontar una foto para volver a montarla», explica Gorka Azkune, profesor en HiTZ, el Centro Vasco de Tecnología de la Lengua de la UPV/EHU. La tecnología clave que está detrás de este proceso son los modelos de difusión. «La idea es coger la imagen real -el papa Francisco, por ejemplo- e ir añadiéndole ruido paso a paso. Esto consiste en coger píxeles -los puntos que forman las imágenes- y cambiarles el color. Al principio siguen siendo reconocibles -el papa sigue siendo el papa-, pero progresivamente se le añade más ruido hasta que al final queda completamente difuminada. Algo así como el Canal + cuando estaba codificado», explica el experto. Con esto se consigue una secuencia que parte de una imagen real y llega hasta otra en la que no se distingue nada, con todos los pasos intermedios.
En este punto entran en juego una red neuronal, una herramienta estadísticas de gran complejidad a la que se enseña a recuperar la imagen original. «Es como ir marcha atrás. Coge la imagen con ruido y se lo va quitando paso a paso hasta conseguir de nuevo la imagen real». Tras desmenuzar la imagen del pontífice, volveríamos a verlo como al principio.
Esta técnica se utilizó en su momento para conseguir imágenes de superresolución. «De una imagen que tiene una resolución dada -tantos píxeles de ancho y tantos de largo-, permite crear otra con la misma información pero con mucha más resolución. Es como en las fotos de un crimen en las que se hace zoom y se sigue viendo muy claro». Dados los buenos resultados que se obtenían, se comenzó a utilizar para generar imágenes a partir de texto hace dos años. Para entrenar a estas red es neuronales, se utilizan bancos de datos públicos en Internet que contienen 5.000 millones de imágenes.
El proceso empieza entonces con el 'prompt', en este caso, algo similar a «imagina al papa sentado en una silla con una parca blanca y unas zapatillas deportivas». Una red neuronal diferente a la antes citada convierte el texto en números -vectores-. Hecho esto, la segunda red neuronal -la del modelo de difusión- tiene ahora tanto la orden del usuario como las imágenes de Francisco y el abrigo, estas gracias a la gigantesca base de datos que maneja. Las descompone y recompone para juntarlas en un montaje que se puede ir ajustando con más 'prompts' hasta conseguir el resultado buscado.
¿Es posible diferenciar estas imágenes de las reales? «Al principio era muy obvio, pero ahora ya es muy difícil. Incluso han ganado concursos de fotografía y arte en Estados Unidos. Su realismo es brutal», dice Azkune. Los expertos aconsejan desconfiar de las imágenes que se hacen virales en Whatsapp, comprobar si llevan la firma de algún fotógrafo o medio de comunicación, compromar los metadatos -información que viene en todas las instantáneas en las que se registra, por ejemplo, con qué teléfono móvil se ha tomado la foto-, fijarse en algunos errores que suelen cometer estas herramientas -suelen tener problemas con las manos, los dientes y las proporciones- y recurrir a programas de detección de estos montajes. También se baraja la posibilidad de que vayan señalizadas con una marca de agua.
¿Ya eres suscriptor/a? Inicia sesión
Publicidad
Publicidad
Te puede interesar
Publicidad
Publicidad
Esta funcionalidad es exclusiva para suscriptores.
Reporta un error en esta noticia
Comentar es una ventaja exclusiva para suscriptores
¿Ya eres suscriptor?
Inicia sesiónNecesitas ser suscriptor para poder votar.