DALL-E - Ritratto di una Geisha Cibernetica

DALL-E Portrait of a Cybernetic Geisha
Il "Ritratto di una Geisha Cibernetica" qui a fianco è generato dal codice di machine learning di questo Google Colab Jupyter Notebook: Aleph 2 Image, creato da Ryan Murdock.

E' uno dei primi esempi di utilizzo di DALL-E (notebook di esempio) con CLIP (Contrastive Language-Image Pre-Training). CLIP è un modello che è stato originariamente inteso per la ricerca della migliore corrispondenza a una descrizione (es: "un cane che suona il violino") tra un certo numero di immagini. Abbinando una rete che può produrre immagini (un "generatore" di qualche tipo) con CLIP, è possibile modificare l'input del generatore per cercare di far corrispondere l'immagine generata alla descrizione.

La prima iterazione di questo metodo usava una rete SIREN come generatore, ed è stata chiamata "DeepDaze" in parte perché le immagini hanno una qualità da "deep dream", un sogno febbrile e nebuloso. La successiva iterazione ha usato BigGAN ed è stata chiamata BigSleep proprio come allusione a DeepDream e al film noir surrealista "The Big Sleep". Il secondo riferimento è sempre dovuto alla sua strana qualità onirica.

Infine, Aleph2Image usa il decoder discreto VQ-VAE di DALL-E. Si chiama così in riferimento a The Aleph, un racconto di Borges su un oggetto che può mostrare tutto il mondo in una volta. Inoltre, include una citazione sulla sorpresa dal racconto.

DALL·E: Generate Images from Text Captions

twitter
Thoughts on DeepDaze, BigSleep, and Aleph2Image

★ Playing with DALL·E 2

★ #dalle2 hashtag

★ DALL-E 2 shows the power of generative deep learning

★ Dall-E 2 vs Disco Diffusion

★ Artists should be more than a little concerned about what this can do now and what it will be able to do in the future.

★ The Dall-E Prompt Book by dallery.gallery

★ Opinion: OpenAI’s DALL-E 2 is the big tech equivalent of ‘soylent green’

[via]

First look - 1,000 Robots by OpenAI Design Director - DALL-E 2 (3.5B) by OpenAI - Launched Apr/2022

OpenAI DALL·E: Creating Images from Text (Blog Post Explained)

Add new comment

The content of this field is kept private and will not be shown publicly.

Full HTML

  • Web page addresses and email addresses turn into links automatically.
  • Lines and paragraphs break automatically.

Filtered HTML

  • Web page addresses and email addresses turn into links automatically.
  • Allowed HTML tags: <a href hreflang> <em> <strong> <cite> <blockquote cite> <code> <ul type> <ol start type='1 A I'> <li> <dl> <dt> <dd> <h2 id='jump-*'> <h3 id> <h4 id> <h5 id> <h6 id>
  • Lines and paragraphs break automatically.