Usuários do assistente de inteligência artificial Gemini, do Google, passaram a relatar em 17/05/2026 mudanças significativas na forma de cálculo dos limites de uso da plataforma. Até então baseados apenas no número de mensagens enviadas, os tetos passaram a considerar o “uso computacional” de cada interação, gerando bloqueios em questão de minutos mesmo após poucas solicitações.
O que mudou nos limites do Gemini
Segundo a página de suporte do Google, o Gemini agora avalia a complexidade de cada prompt, o modelo acionado, os recursos usados e o tamanho do histórico de conversas para definir o consumo de cota. As cotas são renovadas a cada cinco horas e há também um teto semanal. A alteração entrou em vigor em 17 de maio de 2026, segundo comunicado oficial.
Motivos para bloqueios mais rápidos
O novo método de medição leva em conta três fatores principais: a complexidade dos prompts, o volume de histórico no chat e o uso de recursos avançados. Perguntas curtas e diretas consomem pouca cota, enquanto conversas longas com anexos (como PDFs, imagens ou códigos) e recursos como Deep Research ou geração multimodal podem esgotar a cota rapidamente.
Critérios de consumo no novo modelo
O Google detalha que cada tipo de uso impacta de forma diferente:
- Perguntas simples: baixo consumo.
- Conversas extensas: consumo médio a alto, por exigir processamento de contexto.
- Upload de arquivos: alto consumo, pois o sistema interpreta conteúdos adicionais.
- Códigos e cálculos: alto, por necessitar de raciocínio técnico.
- Deep Research e busca aprofundada: muito alto, devido a múltiplas etapas de consulta.
- Geração de imagens ou vídeos: muito alto, pela demanda de recursos computacionais.
Créditos adicionais e planos de assinatura
Razões da mudança e impacto para o usuário
A adoção do modelo baseado em cota computacional atende a demandas econômicas: tarefas mais complexas exigem maior infraestrutura de servidores, manutenção e energia. No entanto, a falta de transparência na métrica gerou insatisfação, já que muitos usuários não conseguem prever quanto cada interação consome.
Imagem: Imagem ilustrativa
Como evitar limites rápidos
Algumas práticas podem ajudar a reduzir o consumo:
- Abrir um novo chat quando o assunto mudar.
- Evitar anexar arquivos desnecessários.
- Dividir tarefas extensas em partes menores.
- Usar Deep Research apenas quando estritamente necessário.
- Resumir o contexto em vez de manter todo o histórico.
Para quem utiliza o Gemini em trabalho ou estudos, a nova regra altera a forma de planejar as interações, uma vez que o limite não é mais contado por mensagem, mas pelo custo computacional de cada atividade.
Com informações de Arevista
Deixe um comentário