Ainda em teste, o DALL-E 2, criado por uma organização financiada pelo empresário Elon Musk, é capaz de gerar imagens realistas a partir do comando de um texto simples
Em um post em sua conta no Twitter no último dia 21 de julho, o empresário e bilionário americano Reid Hoffman, um dos fundadores da plataforma de rede profissional LinkedIn, escreveu: “Uma imagem vale mais que mil palavras. Mas, com DALL-E, o inverso é verdadeiro: uma única palavra vale mais que mil imagens”.
Hoffman se referia à versão beta do novo sistema de inteligência artificial criado pelo laboratório de pesquisas OpenAI, uma organização que tem como um dos financiadores o empresário Elon Musk, o principal acionista da montadora Tesla. Batizado de DALL-E 2 por ser uma versão aprimorada do DALL-E, lançado em janeiro de 2021, trata-se de um sistema capaz de criar imagens realistas a partir do comando de um texto simples.
A imagem abaixo, por exemplo, foi gerada a partir do seguinte texto: “Uma cabeça de macaco que é feita apenas de frutas, 3D”.
“Grandes artistas sempre foram grandes inovadores. Se artistas inovadores como Da Vinci, Pablo Picasso, Georgia O’Keefe e Frida Kahlo estivessem vivos hoje, tenho certeza de que estariam experimentando o DALL-E”, disse Hoffman no Twitter. (O nome DALL-E, a propósito, é um trocadilho com o nome do pintor espanhol Salvador Dalí e o robô Wall-E do filme homônimo da Pixar/Disney.)
O próprio Hoffman, que é membro do conselho da OpenAI, já lançou uma série de NFTs (tokens não fungíveis) baseados na criptomoeda Solana a partir de imagens criadas com o DALL-E 2. A série foi batizada de Untranslatable Words (“palavras intraduzíveis”). Um NFT é um token criado com a tecnologia da blockchain e que pode comprovar a propriedade de um item único, como obras de arte e colecionáveis.
“Fiquei impressionado com a forma como o DALL-E cria simultaneamente abundância digital e escassez digital”, continuou Hoffman no Twitter. “Abundância digital: em poucas horas, um único usuário sem experiência artística pode gerar centenas de imagens renderizadas com maestria. Cada um deles poderia levar horas ou dias de trabalho para ser concluído usando métodos tradicionais (incluindo software).”
E completou seu raciocínio: “Escassez digital: mas enquanto o DALL-E produz imagens quase na velocidade de fazer cópias, nunca é simplesmente fazer cópias. Cada imagem é um recurso original único. Você poderia até dizer que o DALL-E está aumentando a escassez em escala”.
A imagem abaixo foi criada por Hoffman e vendida no mercado de NFT Magic Eden por quase 700 solanas, cerca de 24 mil dólares. O empresário afirma que pretende dividir os recursos arrecadados com a venda das peças entre causas beneficentes e sua equipe de colaboradores.
De acordo com a OpenAI, a DALL-E 2 é capaz de adicionar e remover elementos enquanto leva em consideração sombras, reflexos e texturas. O sistema pode pegar uma imagem existente e, a partir dela, criar diferentes variações. O DALL-E 2 aprende a relação existente entre as imagens e o texto usado para descrevê-las. Ele utiliza um processo chamado “difusão”, que começa com um padrão de pontos aleatórios e, gradualmente, altera esse padrão em direção a uma imagem quando reconhece aspectos específicos dessa imagem.
O DALL-E 2 começou como um projeto de pesquisa e está disponível agora na versão beta. Ou seja, é um produto ainda em estágio de desenvolvimento, mas considerado aceitável para ser divulgado ao público, para que sejam identificados possíveis bugs e problemas que precisarão ser corrigidos pelos desenvolvedores antes do lançamento definitivo do produto ao mercado. Por enquanto, apenas pessoas que se inscreveram em uma lista de espera da OpenAI têm acesso ao produto.
Uma das preocupações é evitar que o DALL-E 2 seja usado para criar imagens realistas com fins maliciosos. Em tempo de fake news, não é difícil imaginar, por exemplo, um dos lados do conflito entre a Rússia e a Ucrânia criar imagens distorcidas da guerra com o objetivo de induzir a opinião púbica mundial contra o país inimigo. No Brasil, em ano de eleições, o sistema de inteligência artificial poderia ser usado para gerar imagens comprometedoras dos adversários políticos.
“Limitamos a capacidade do DALL-E 2 de gerar imagens violentas, de ódio ou adultas. Ao remover o conteúdo mais explícito dos dados de treinamento, minimizamos a exposição do DALL-E 2 a esses conceitos. Também usamos técnicas avançadas para evitar gerações fotorrealistas de rostos de indivíduos reais, incluindo os de figuras públicas”, diz a OpenAI em seu site.
Para prevenir o uso indevido da ferramenta, a organização afirma que está adotando medidas para evitar que os usuários gerem conteúdo violento, adulto ou político, entre outras categorias. “Não geraremos imagens se nossos filtros identificarem solicitações de texto e uploads de imagens que possam violar nossas políticas. Também temos sistemas de monitoramento automatizados e humanos para proteção contra uso indevido”, afirma.