Promptografia: la fotografia intel·ligent

Les millors IA generadores d’imatges 

La nova i millorada versió de DALL-E 2, la IA generadora d’imatges desenvolupada per OpenAI, entén millor i de manera molt més completa les descripcions de text que els usuaris introdueixen per generar les imatges. Una altra característica molt útil de DALL·E 3 és la capacitat per incloure paraules o frases a les imatges.

És un petit laboratori de recerca independent que dona bons resultats amb prompts breus. Cal accedir-hi amb un compte de Discord mitjançant Midjourney Bot o la plataforma web i ofereix al voltant de 25 imatges gratuïtes 

És una IA generadora d’imatges gratuïta que demana un compte a Discord i unir-se al servidor de l’eina. S’ha de seleccionar algun dels canals, introduir l’ordre «/image promt» i la descripció de l’obra que es vulgui generar. També ofereix l’opció de generar variacions de les propostes generades.

Està creada per Stability AI, una comunitat formada per més de 140.000 desenvolupadors i es basa en el model de generació d’imatges de codi obert Stable Diffusion. S’hi pot accedir començant per una primera prova gratuïta i, un cop esgotades les imatges gratis, s’ha de pagar una recàrrega mínima de 10 lliures per continuar fent-la servir. 

Aquesta eina desenvolupada per Adobe ha estat entrenada amb conjunts de dades de llicència oberta i Adobe Stock, en col·laboració amb NVIDIA, empresa tecnològica nord-americana especialitzada en la creació d’unitats de pensament gràfic. Permet generar imatges a partir d’una descripció, i també a partir d’un esbós creat per l’usuari. Està previst que, properament, Adobe l’integri en eines del seu ecosistema.

Genera imatges que integren text, altres imatges o formes geomètriques en gràfics d’aparença normal, sovint paisatges. Entre les seves diverses eines, Krea n’inclou una denominada ‘Introducing patterns’ (introduint patrons) enfocada precisament a crear aquesta classe d’imatges, especificant, d’una banda, el prompt de la imatge pròpiament dita i, de l’altra, el patró.

Com escriure el prompt més ajustat a la imatge que vols

A l’era de la intel·ligència artificial, la creació d’imatges descrites mitjançant text és una eina poderosa per a artistes i dissenyadors. La clau per aconseguir imatges reeixides generades d’aquesta manera rau en la redacció precisa del “prompt”.

  • L’especificitat importa: la redacció acurada i específica del teu prompt és fonamental per obtenir resultats precisos. Utilitza descripcions detallades en lloc de generalitats.
  • Les paraules clau són útils: en lloc de frases completes, considera utilitzar paraules clau per centrar-te en els elements més importants del teu prompt.
  • Escull l’estil artístic: decideix l’estil artístic que desitges, ja que pot tenir un impacte significatiu en l’aparença final. Pots triar entre estils com “pintura a l’oli”, “realista”, “còmic”,”anime”, etc.
  • Detalls del subjecte: a més de descriure el subjecte principal, especifica les seves propietats físiques i qualitats, com “anatòmicament correcte” o “postura dinàmica”, etc.
  • Nivell de detall: si vols una imatge altament detallada, indica-ho al prompt utilitzant termes com “4k” o “alta resolució”.
  • El fons i l’entorn com a complement: si vols un fons específic o un entorn, assegura’t d’incloure aquestes indicacions en el prompt per afegir realisme a la imatge.
  • Afegeix dinamisme: per fer que la imatge sigui més dinàmica, considera incloure accions com “saltant”, “corrent” o “ballant” en la descripció.
  • Restriccions de contingut cada cop més rígides

  •  Una de les últimes novetats emprades per les principals plataformes és la prohibició de generar imatges de persones famoses; tothom recorda aquelles escenes d’una falsa detenció policial de l’expresident Donald Trump que van donar la volta al món al març d’aquest any, quan encara s’estudiaven els límits d’aquesta tècnica.
  • A banda, aquestes aplicacions no permeten el contingut sexual explícit, les imatges violentes, el contingut discriminatori, xenòfob o d’odi, les imatges que infringeixin els drets d’autor o altres drets de propietat intel·lectual, que violin la privadesa de les persones, com la creació de deepfakes no consensuats, la generació d’imatges que representin activitats il·legals, que siguin extremament gràfiques, pertorbadores o impactants, i que continguin amenaces o assetjament. Com no podia ser d’altra manera, hi ha plataformes que se salten algunes d’aquestes limitacions, com ara Picso, Unstable diffusion, Craiyon, Nightcafe o Mage Space. En tot cas, el que sí que està clarament penalitzat és la compartició d’aquest tipus de material.