O Google anunciou uma atualização significativa em seu modelo de geração de imagens, o Gemini 2.0, com melhorias que prometem transformar a forma como desenvolvedores e usuários interagem com a inteligência artificial (IA) para criar conteúdo visual. Em um post no X desta quarta-feira (7), Logan Kilpatrick, uma das vozes do Google, detalhou as novidades.
O modelo agora oferece melhor qualidade visual, renderização de texto mais precisa, taxas de bloqueio reduzidas, limites de uso mais altos e um custo de US$ 0,039 por imagem gerada. A atualização, que já está disponível no Gemini app e na API, foi celebrada por Kilpatrick como um marco para colocar a tecnologia nas mãos dos desenvolvedores, com rollout iniciado para 100% dos usuários no AI Studio e API.
O que há de novo na nova versão da Gemini, segundo o Google
A nova versão do Gemini 2.0 Image Generation traz avanços significativos em relação ao seu antecessor, Gemini 2.0 Flash, lançado em março de 2025. Segundo um post no blog do Google Developers, o modelo anterior já se destacava por sua capacidade de combinar texto e geração de imagens em um único sistema, permitindo criar histórias ilustradas interativas e consistentes.
A atualização, no entanto, eleva o padrão com renderizações mais nítidas e detalhadas, especialmente úteis para aplicações como anúncios, postagens em redes sociais e convites, conforme destacado em benchmarks internos do Google.
Segundo Kilpatrick, a funcionalidade não exige seleção manual de modelo, sendo ativada automaticamente conforme o contexto da solicitação.
A redução nas taxas de bloqueio e o aumento nos limites de uso tornam o Gemini 2.0 mais acessível para desenvolvedores, enquanto o preço competitivo de US$ 0,039 por imagem gerada o posiciona como uma alternativa atraente no mercado de geração de imagens por IA, competindo com ferramentas como o DALL-E da OpenAI e o MidJourney.