Uno de los temas de los que más se ha estado hablando este año es de las Inteligencias Artificiales que generan imágenes a partir de texto. Ahí están Midjourney, que incluso ha ganado un concurso de pintura, NightCafe, Wombo o la española Geniverse que salió en Órbita Laika, entre muchísimas otras que están saliendo ahora.

Pero la que seguro que es más conocida y que ha recibido más atención de los medios es, sin duda, Dall·E 2.

La verdad es que tenía ganas de echarle el guante para probarla, prácticamente desde que se anunció, por las razones que seguro que ya imagináis. ¿Quién no iba a querer una fuente inagotable de imágenes personalizadas para el blog, para ilustrar algún cuento… o incluso rol? Por eso me apunté para probar la beta en cuanto supe de su existencia. Peeero mi turno nunca llegó. Y ha sido hace poco, cuando abrieron la IA para todo el mundo, cuando por fin pude acceder.

Sin embargo, cuando leí que iba a tener 50 intentos, más 15 cada mes, decidí esperar y reservármelos para algo que mereciera la pena. Un gran error, porque, como ponen en su web, cuando pasa el mes los intentos se te resetean a 15 y pierdes los que no hayas usado. Así que, si os registráis ahora, ¡gastad esos 50 iniciales cuanto antes!

La oportunidad

Ese «algo especial» que esperaba se presentó hace unos días. Picado por esa editorial-de-un-solo-hombre que es Juancho Duma (el famoso Agente Especial), sus artículos sobre el rol por Telegram y su canal de Campañas por Telegram, creé una partida en WhatsApp para Fusa. En ella está interpretando a una versión peliculera de ella misma en una realidad muy parecida a la nuestra. Tan, tan parecida, que la partida comienza con ella acompañando a una amiga a su casa a por un paraguas, aprovechando un recreo del instituto.

Mientras describíamos lo que iba pasando, iba salpimentando las descripciones con fotos de la zona procedentes de Google Maps, con algún que otro retoque con GIMP. Así que, cuando en un momento determinado apareció un vórtice en mitad del aire y unas manos arrastraban a su amiga adentro, necesitaba unas imágenes lo más fotorrealistas posibles para que no desentonaran con lo que llevábamos hasta el momento.

Y ese fue el momento de la verdad para Dall·E 2. ¿Sería capaz de hacerme algo medianamente utilizable?

La primera frase que le introduje fue esta:

A photorrealistic picture of a whirling and bright vortex on a graffited wall, with two human and gloved hands protuding from it to capture a female auburn teenager while a second teenager watches in terror

Con cada intento la IA genera cuatro imágenes, que para esta descripción fueron estas:

Puesss… tal vez las más utilizables serían la primera y la última. Y no sé si es que mi inglés es demasiado atroz, pero en ninguna opción hay manos que salgan a atrapar a una adolescente aterrorizada. Por no hablar del ¿fotorrealismo?. Los únicos aciertos diría que son el número de personas, la pared con grafittis… ah, sí, y que hay manos enguantadas.

El siguiente intento lo gasté en que hiciera variaciones sobre la imagen que más se aproximaba a lo que tenía en mente, que era la de la chica de la coleta. Y estas fueron las 4 imágenes siguientes:

La cosa se vuelve demasiado onírica, con manos esturreadas por la imagen sin ton ni son. Tampoco sé muy bien por qué la IA me pinta un señor en la última imagen. En fin, allá va otro intento.

Como lo del vortex naranja me sacaba un poco de quicio, decidí reformular ligeramente la frase a esta otra:

A photorrealistic picture of a whirling white vortex on a graffited wall, with two hands emerging from it to hold a terrified female auburn teenager, while a second teenager watches in terror

Y con esos mimbres Dall·E 2 me sacó esto:

De nuevo, el tan cacareado fotorrealismo brilla por su ausencia, pero es verdad que esto ya empieza a aproximarse mucho más al concepto original. Pero sigue sin haber unas manos surgiendo del vórtice, lo que era un elemento central en la descripción que había hecho en el WhatsApp.

Así que decidí centrar mucho más el tiro:

A photorrealistic picture of two hands emerging from a bright white vortex to capture a terrified female teenager

Y aquí los resultados ya se van ajustando más, sin ser exactamente lo que le estaba pidiendo:

Lo tenía tan cerca que casi casi podía olerlo, así que venga, a por otro intento más:

A photorrealistic picture of two hands emerging from a bright white rift in space, capturing a terrified female teenager

Nada, que no había manera de que me pinte unas manos atrapando a alguien, no digamos ya lo del fotorrealismo. Así que al final opté por esta última imagen, que al menos era la que se ajustaba más a mi descripción, y seguí adelante con la partida.

En definitiva

Lo positivo es que al menos pude enviar algo al WhatsApp en un espacio de tiempo razonable. Dudo que hubiera encontrado en Google Images algo remotamente parecido en ese mismo espacio de tiempo. Peeeero… lo cierto es que los resultados fueron un poco decepcionantes, al menos con las expectativas desde las que partía.

¿Habrá sido mi terrible nivel de inglés? ¿Debería no haber insistido en el fotorrealismo? ¿Era una escena demasiado complicada, específica y/o rara? ¿No gasté los suficientes intentos? ¿Soy muy tiquismiquis? ¿Todo lo anterior?

Supongo que aún nos queda mucho por aprender, tanto a la Inteligencia Artificial como a mí 😉

Artículo anteriorPetit Pop
Artículo siguienteTablas en perchance.org para Five Parsecs from Home

1 COMENTARIO

  1. Pues es un poco como todo. Si se usa bien, como en su caso, puede ser positivo. Pero si se usa para sustituir a los ilustradores profesionales «de carne y hueso» pues ya deja de serlo. Yo no pienso que vaya a acabar quitando el trabajo a nadie. Al principio tendra mucho bombo y despues encontrara su nicho. Un saludo.

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.