Anatomía de una Imágen Creada por IA

Miguel Merino

Es Magia


Como fotógrafo, desde la primera imagen que vi generada por mi Journey, me quedé fascinado. Los no entendidos en fotografía, probablemente pasan por alto muchos detalles que son realmente mágicos.
En este video quería analizar esos múltiples detalles que aparecen con tanto realismo y perfección en las imágenes creadas por Midjourney, y que pasan desapercibidos por la mayoría de la gente

Un primer plano de una chica, generado por Midjourney


¿Cómo se Crea?


Antes que nada, quería comentar brevemente cuál es el proceso mediante el cual se generan estas imágenes, que para mí, es magia.

Se trata de un modelo matemático-estadístico llamado de difusión. Es extremadamente complejo, pero la base de su funcionamiento se puede explicar fácilmente.

Al modelo se le da una imagen y un texto que explica esa imagen mediante texto. A continuación, el modelo empieza a generar ruido en la imagen, de forma iterativa, hasta que la imagen desaparece y queda solamente una nube de puntos.

Así funciona Midjourney: se ha entrenado con miles de millones de pares Imagen+Texto para aprender el elnguaje humano

Después, el modelo vuelve a reconstruir la imagen original siguiendo el proceso inverso, es decir partiendo de una nube de puntos aleatoria, va generando una imagen, de forma iterativa, hasta terminar con la imagen completamente reconstruida.

De esta manera el modelo ha aprendido, por una parte, cuál es el texto que describe esa imagen, y por otra, como construirla partiendo de una nube de puntos aleatorio.

Aún así, sigo pensando que es mágico…

Este es el proceso mediante el cual Midjourney crea las imagenes a aprtir de un texto: el origen no es más que una nube aleatoria de puntos, que poco a poco, van formando una imagen.

Anatomía de una Imagen


En la siguiente imagen que he generado en Midjourney, tenemos una multitud de detalles fotográficos realmente increíbles. Vamos a empezar el análisis por el encuadre:


El Encuadre


El sujeto está centrado, Lo cual es una acertada composición dado que la imagen es cuadrada.

La pose de la chica es natural y equilibrada: los brazos crean un triángulo y la cabeza ligeramente ladeada hacia la izquierda, crea una suave diagonal, paralela a uno de los brazos, que aporta más interés visual, que si la cabeza estuviese completamente recta.

Tenemos en total cuatro diagonales y un triángulo... ¡No está mal! ¿Y esto lo ha hecho una máquina?

Una composición interesante: 4 diagonales y uno (¿o dos?) triángulos y ! todos ellos en armonia!

Como puedes ver, MidJourney ha sido capaz de generar las manos correctamente. Por si no lo sabes, éste era una de las importantes limitaciones que tenía la versión cuatro de MJ, porque a menudo no era capaz de generar manos correctamente.


En mi opinión, la taza en primer plano sobra, aunque tampoco molesta demasiado. La mesa de madera también en primer plano, me parece que está bien resuelta, y ocupa aproximadamente un 20% de la altura, coincidiendo aproximadamente con una distribución de Pareto (la del 80-20).

La chica viste una blusa estampada en tonos azules, con un dibujo agradable y con pliegues naturales.


La piel, como en todos los retratos fotorrealistas que genera MJ, está bien conseguida, aunque quizá un poco menos de perfección le daría un aspecto más natural. El color de la piel, es acertado, con distintos degradados, más claro en el dorso de la mano, y más oscuro en el resto.

Respecto a la cara, hay gente que opina que el modelo tiene un sesgo hacia el concepto de belleza femenino occidental. Esto es evidente que es así, pero a mí personalmente, no me molesta en absoluto. Es más, este tipo de belleza serena y elegante -que es la que MJ genera por defecto- me parece estupenda.

Todas las facciones me parecen acertadas, tanto con respecto a los ojos y la mirada que conectan con el espectador, como con unos labios carnosos y sensuales, pero sin exageraciones.

Quizá la nariz es el único detalle que es menos delicado por así decirlo, pero curiosamente, he comprobado que MJ crea con frecuencia este tipo de nariz, lo cual tiene que ser porqué una parte importante de las imágenes con las que se ha entrenado al modelo, tenían este estilo de nariz y el modelo ha aprendido que es una nariz que se corresponde con el canon de belleza occidental...

El Segundo Plano


Antes de entrar a analizar la luz, vamos a ver primero el fondo o segundo plano, que tiene poca profundidad de campo para separar el sujeto del mismo, pero la suficiente como para intuir lo que hay detrás de la chica, como por ejemplo una mesa y unas sillas, una persona, un cuadro, una lámpara de techo y un ventanal a la derecha de la imagen, con gruesos marcos de madera oscura.

Como detalle adicional, sutil pero muy visual está el logrado Bokeh, es decir, el desenfoque de las luces del fondo, a modo de círculos.

Me parece un fondo muy bien logrado, que separa perfectamente los dos planos, pero que además aporta interés visual a la imagen.

La Luz y el Color


Por último, la iluminación es una de los aspectos que más me fascinan de estas imágenes creadas con inteligencia artificial.


En el sujeto, se ve claramente una iluminación lateral, que suponemos viene de otro ventanal a la izquierda de la chica, que proyecta una luz poco intensa y difusa, lo que crea ese precioso y suave contraste entre ambos lados de la cara de la chica, y también en los brazos y manos. La delicadeza y el acierto con el que está iluminada la chica ¡me parece espectacular!

Y el color ¡qué decir! Tonos tierra suaves combinados con tonos de azul, su color complementario. ¡Nada se ha dejado al azar!


Bueno, y después de ver todo esto, vuelve por un momento a recordar que esto ¡lo ha creado un programa informático en base a unas palabras que le has escrito!

Ten muy en cuenta que la grandeza de la IA es que genera desde cero una imagen. No ha copiado y pegado cosas de diversas fotos, como haríamos en Photoshop. Es como si la hubiese pintado delicadamente, con una calidad fotorrealista, y todo esto, desde su propia imaginación.

Todos esos detalles y sutilezas que hemos analizado, provienen de un programa informático...

 ¿No te parece fascinante? A mí ¡me parece mágico!


Cuéntame tu experiencia con la IA y qué piensas de esta nueva e inmensa oportunidad creativa.

SOBRE EL AUTOR

Miguel Merino es un Fotógrafo Profesional durante más de 20 años, emprendedor, escritor y conferenciante y apasionado de todas técnicas que permitan retratar el mundo desde nuevas e inéditas perspectivas .