Usando Dall·E 2 para generar una imagen en mitad de una partida

Uno de los temas de los que más se ha estado hablando este año es de las Inteligencias Artificiales que generan imágenes a partir de texto. Ahí están Midjourney, que incluso ha ganado un concurso de pintura, NightCafe, Wombo o la española Geniverse que salió en Órbita Laika, entre muchísimas otras que están saliendo ahora.

Pero la que seguro que es más conocida y que ha recibido más atención de los medios es, sin duda, Dall·E 2.

La verdad es que tenía ganas de echarle el guante para probarla, prácticamente desde que se anunció, por las razones que seguro que ya imagináis. ¿Quién no iba a querer una fuente inagotable de imágenes personalizadas para el blog, para ilustrar algún cuento… o incluso rol? Por eso me apunté para probar la beta en cuanto supe de su existencia. Peeero mi turno nunca llegó. Y ha sido hace poco, cuando abrieron la IA para todo el mundo, cuando por fin pude acceder.

Sin embargo, cuando leí que iba a tener 50 intentos, más 15 cada mes, decidí esperar y reservármelos para algo que mereciera la pena. Un gran error, porque, como ponen en su web, cuando pasa el mes los intentos se te resetean a 15 y pierdes los que no hayas usado. Así que, si os registráis ahora, ¡gastad esos 50 iniciales cuanto antes!

La oportunidad

Ese «algo especial» que esperaba se presentó hace unos días. Picado por esa editorial-de-un-solo-hombre que es Juancho Duma (el famoso Agente Especial), sus artículos sobre el rol por Telegram y su canal de Campañas por Telegram, creé una partida en WhatsApp para Fusa. En ella está interpretando a una versión peliculera de ella misma en una realidad muy parecida a la nuestra. Tan, tan parecida, que la partida comienza con ella acompañando a una amiga a su casa a por un paraguas, aprovechando un recreo del instituto.

Mientras describíamos lo que iba pasando, iba salpimentando las descripciones con fotos de la zona procedentes de Google Maps, con algún que otro retoque con GIMP. Así que, cuando en un momento determinado apareció un vórtice en mitad del aire y unas manos arrastraban a su amiga adentro, necesitaba unas imágenes lo más fotorrealistas posibles para que no desentonaran con lo que llevábamos hasta el momento.

Y ese fue el momento de la verdad para Dall·E 2. ¿Sería capaz de hacerme algo medianamente utilizable?

La primera frase que le introduje fue esta:

A photorrealistic picture of a whirling and bright vortex on a graffited wall, with two human and gloved hands protuding from it to capture a female auburn teenager while a second teenager watches in terror

Con cada intento la IA genera cuatro imágenes, que para esta descripción fueron estas:

Puesss… tal vez las más utilizables serían la primera y la última. Y no sé si es que mi inglés es demasiado atroz, pero en ninguna opción hay manos que salgan a atrapar a una adolescente aterrorizada. Por no hablar del ¿fotorrealismo?. Los únicos aciertos diría que son el número de personas, la pared con grafittis… ah, sí, y que hay manos enguantadas.

El siguiente intento lo gasté en que hiciera variaciones sobre la imagen que más se aproximaba a lo que tenía en mente, que era la de la chica de la coleta. Y estas fueron las 4 imágenes siguientes:

La cosa se vuelve demasiado onírica, con manos esturreadas por la imagen sin ton ni son. Tampoco sé muy bien por qué la IA me pinta un señor en la última imagen. En fin, allá va otro intento.

Como lo del vortex naranja me sacaba un poco de quicio, decidí reformular ligeramente la frase a esta otra:

A photorrealistic picture of a whirling white vortex on a graffited wall, with two hands emerging from it to hold a terrified female auburn teenager, while a second teenager watches in terror

Y con esos mimbres Dall·E 2 me sacó esto:

De nuevo, el tan cacareado fotorrealismo brilla por su ausencia, pero es verdad que esto ya empieza a aproximarse mucho más al concepto original. Pero sigue sin haber unas manos surgiendo del vórtice, lo que era un elemento central en la descripción que había hecho en el WhatsApp.

Así que decidí centrar mucho más el tiro:

A photorrealistic picture of two hands emerging from a bright white vortex to capture a terrified female teenager

Y aquí los resultados ya se van ajustando más, sin ser exactamente lo que le estaba pidiendo:

Lo tenía tan cerca que casi casi podía olerlo, así que venga, a por otro intento más:

A photorrealistic picture of two hands emerging from a bright white rift in space, capturing a terrified female teenager

Nada, que no había manera de que me pinte unas manos atrapando a alguien, no digamos ya lo del fotorrealismo. Así que al final opté por esta última imagen, que al menos era la que se ajustaba más a mi descripción, y seguí adelante con la partida.

En definitiva

Lo positivo es que al menos pude enviar algo al WhatsApp en un espacio de tiempo razonable. Dudo que hubiera encontrado en Google Images algo remotamente parecido en ese mismo espacio de tiempo. Peeeero… lo cierto es que los resultados fueron un poco decepcionantes, al menos con las expectativas desde las que partía.

¿Habrá sido mi terrible nivel de inglés? ¿Debería no haber insistido en el fotorrealismo? ¿Era una escena demasiado complicada, específica y/o rara? ¿No gasté los suficientes intentos? ¿Soy muy tiquismiquis? ¿Todo lo anterior?

Supongo que aún nos queda mucho por aprender, tanto a la Inteligencia Artificial como a mí 😉

Comentarios

Una respuesta a «Usando Dall·E 2 para generar una imagen en mitad de una partida»

  1. Avatar de lobo de piedra

    Pues es un poco como todo. Si se usa bien, como en su caso, puede ser positivo. Pero si se usa para sustituir a los ilustradores profesionales «de carne y hueso» pues ya deja de serlo. Yo no pienso que vaya a acabar quitando el trabajo a nadie. Al principio tendra mucho bombo y despues encontrara su nicho. Un saludo.

Responder a lobo de piedra Cancelar la respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Sobre el autor


Entradas relacionadas


Etiquetas

android aplicaciones blogs Canción de Hielo y Fuego cine d&d d6 dados disney evangelización frikismo geralt de rivia gygax historia internet libros Ludo Ergo Sum Mazes & Minotaurs mecánicas extrañas medieval Música niños padre Pathfinder piratas poliedro Reseñas risus rol rol con niños roleando rolesfera rol español rol gratis rol para niños Star Wars superhéroes taller televisión terror tiendas videojuegos videos vieja escuela zombis


Blogs de rol en Castellano

  • por rolerosnorepresentativos
    Os presentamos la primera entrada de esta nueva sección de vuestro Blog Rolerø No Representativø favorito. Desde el grupo queremos aprovechar el pequeño altavoz del que disponemos para visibilizar el trabajo de ilustradores e ilustradoras. […]
  • por Copromante
    Se trata de un extraño yelmo con forma de cabeza de toro, ricamente ornamentado con una cobertura de plata y unos cuernos de bronce cubiertos con pintura de oro. El yelmo además estuvo, probablemente, pintado […]
  • por Copromante
    Los parasoles y paraguas mágicos han sido un elemento recurrente desde que el sr. Mollino abrió su tienda hace tres siglos en el infame Mercado Goblin York. Vistos como el sustituto natural de las varitas […]
  • por RNR38
    Aviso para lectores: esta publicación no pretende debatir sobre lo que es “bueno” o “malo” en los juegos, ni pontificar acerca de cómo deberían ser según las distintas inquietudes y motivaciones expresadas en los manifiestos […]
  • por Terrax
    Nota: Este artículo es una traducción de la página Sly Flourish.com cuya autoría es de Mike Shea y del cual tenéis el enlace al post original aquí. Esta traducción se realiza con su consentimiento expreso. Os invito a seguirle a […]
  • por cine3D
     Muchas gracias a Joorgemh por traducir estos libros de la torre y la flor, los 6 primeros pertenecen a la colección mayor y el último a la menor, todavía quedan algunos títulos más.
  • por Tristán Oberón
    Siempre digo que uno de los retos más importantes que tienen por delante los creadores de cualquier juego de rol es diseñar y escribir sus primeras partidas. Para mí son lo que definen realmente el […]
  • por williamdarkgates
    ¿Por qué no me gusta Mörk Borg? Lo confieso: Mörk Borg no me agrada. Hay algo en ese juego que simplemente no me llama la atención. Los OSR, en general, no son lo mío. Aunque […]
  • por Copromante
    Sulis era el nombre de la diosa local de las aguas que aún alimentan los baños termales de Bath, que los romanos llamaban Aquae Sulis («las aguas de Sulis»). Su nombre derivaba del irlandés antiguo súil («ojo» […]
  • por sayko2020
    Lydia dice: Midnight Arms tiene lo que necesitas. ¿Lo tienes tú? Extraído y traducido de Soldier of Fortune 2 página 13 por sayko2k20 Midnight Firms se ha convertido en el distribuidor exclusivo en el Estado […]

Blogs de rol en Inglés

  • por James Maliszewski
    Here's another public post from my Patreon about the development of Dream-Quest. As always, I invite comments on the post, since I'm still turning over ideas in my head and appreciate other perspectives. In this […]
  • por -C
     It tells you how to do it. Available Now!https://sinlessrpg.comHack & Slash Follow, Twitch, Support, Donate to end Cancer (5 Star Rating) sinlessrpg.com
  • por James Maliszewski
    Judging by the fact that this is the third post in a row about Dragon issue #90 (October 1984), I think it’s safe to say it was a good one. The funny thing is, before […]
  • por Konsumterra
    Most living floors have 5 huge domes and multiple sub and over service levels. There are other secret, smaller habitats between domes. So far, players have found a prehistoric living gnome city in the deep […]
  • por pookie
    Much like the Miskatonic Repository for Call of Cthulhu, Seventh Edition, the Jonstown Compendium is a curated platform for user-made content, but for material set in Greg Stafford’s mythic universe of Glorantha. It enables creators […]
  • por John Frazer
     Oh no, I may be in trouble. Eberron looks like it's shaping up to be exactly the sort of fantasy rpg setting that's guaranteed to activate my worst instincts as a critic – a high-concept subversion […]
  • por James Maliszewski
    Troubleshooting (Part II) by James MaliszewskiA New Frame for Thousand SunsRead on Substack
  • por -C
     Insanity sucks. Available Now!https://sinlessrpg.comHack & Slash Follow, Twitch, Support, Donate to end Cancer (5 Star Rating) sinlessrpg.com
  • por pookie
    Much like the Jonstown Compendium for RuneQuest: Roleplaying in Glorantha and The Companions of Arthur for material set in Greg Stafford’s masterpiece of Arthurian legend and romance, Pendragon, the Miskatonic Repository for Call of Cthulhu, […]
  • por James Maliszewski
    First published in the July 1943 issue of Weird Tales, Robert Bloch’s “Yours Truly, Jack the Ripper” remains one of the author’s most famous short stories. In less than a dozen pages, Bloch manages to do […]