Google disponibiliza gratuitamente o modo Extended Thinking do Gemini para todos os usuários

O recurso conhecido como Extended Thinking do Gemini, que permite ao assistente de inteligência artificial da Google realizar um raciocínio mais demorado antes de fornecer uma resposta, agora está acessível a todos os usuários. Essa liberação abrange tanto os planos gratuitos quanto os pagos, alcançando simultaneamente a versão web, o aplicativo para Android e o app para iOS.

A informação foi divulgada por Josh Woodward, vice-presidente do Gemini na Google, em uma postagem na plataforma X. Ele afirmou que as novas funcionalidades já estão disponíveis para usuários nas três principais plataformas.

Essa expansão marca o fim de uma fase de testes iniciada em torno do Google I/O 2026, quando o recurso foi disponibilizado apenas para um grupo limitado de pessoas.

Alterações com o raciocínio prolongado do Gemini

A nova funcionalidade proporciona aos usuários uma opção inédita: selecionar o nível de esforço que a IA deve empregar para responder a cada solicitação. Essa escolha pode ser feita nas configurações do modelo do Gemini, onde estão disponíveis duas opções principais: Standard e Extended.

No modo padrão, as respostas são geradas rapidamente e essa configuração é recomendada pela Google para questões cotidianas, como resumos ou perguntas simples. Por outro lado, o modo Extended permite um tempo maior de processamento e utiliza um raciocínio mais detalhado antes de apresentar a resposta final.

A documentação oficial da Google explica essa distinção claramente. O raciocínio padrão é ideal para a maioria das perguntas e proporciona respostas rápidas, enquanto o raciocínio estendido é mais apropriado para resolver questões complexas, refletindo mais sobre o comando antes de responder.

“O raciocínio estendido é mais eficaz na resolução de problemas complexos. Com ele, o modelo terá mais tempo para considerar seu comando antes de oferecer uma resposta.”

Essa lógica é semelhante ao que já era oferecido no AI Studio da Google, voltado para desenvolvedores, onde eram utilizados níveis como Low, Medium e High. Para a versão consumidora, a escolha foi simplificada em apenas dois botões, facilitando para aqueles que não têm familiaridade técnica com ajustes de inferência.

Modelos que suportam este recurso

A alternativa entre Standard e Extended está presente nos modelos da linha Flash, que são leves e rápidos. Essa opção é válida tanto para o Gemini 3.5 Flash quanto para o Gemini 3.5 Flash-light e está disponível tanto para contas gratuitas quanto para assinantes.

Além disso, existe um terceiro nível superior chamado Deep Think. Este modo oferece um raciocínio paralelo avançado que permite explorar várias hipóteses simultaneamente, podendo levar alguns minutos para gerar uma única resposta. No entanto, esse recurso exige acesso ao modelo Pro e é exclusivo dos assinantes do plano AI Ultra, a opção mais cara da Google.

A tabela abaixo ilustra como os níveis se distribuem entre os diferentes modelos:

Desvantagem: aumento no consumo de créditos

A utilização gratuita vem com uma advertência importante: ativar o raciocínio estendido pode rapidamente esgotar os limites de uso em comparação ao modo padrão, pois cada resposta demanda um processamento significativamente maior.

Esse aspecto é delicado devido às críticas recebidas pela Google em relação às recentes alterações em seu sistema de limites.

Desde 17 de maio de 2026, a companhia passou a implementar limites baseados no consumo computacional. Esses limites consideram a complexidade da solicitação, o modelo selecionado e a duração da conversa. A própria Google admite em sua documentação que modelos mais avançados e níveis superiores consomem mais da cota disponível.

Na prática, quem optar pelo modo Extended para tarefas simples corre o risco de utilizar sua franquia desnecessariamente. A sugestão é reservar essa funcionalidade apenas para questões que realmente exijam uma análise mais aprofundada e manter o modo Standard para buscas comuns ou perguntas menos complexas.

É importante lembrar que esse comportamento está alinhado com outras iniciativas da Google na área de IA. A franquia de uso se renova a cada cinco horas até atingir o limite semanal estipulado; usuários sem plano pago podem ter funções como Deep Research suspensas durante períodos de alta demanda.

Custos para upgrade no Gemini

Aqueles que desejam evitar limites restritivos podem optar por assinar um dos planos da Google AI. O AI Plus duplica os limites padrão; já o AI Pro quadruplica esses limites; por sua vez, o AI Ultra pode oferecer entre 5 a 20 vezes os limites do Pro conforme a modalidade escolhida.

O Brasil está incluído entre os países onde estão disponíveis as opções AI Plus, AI Pro e AI Ultra. O plano Ultra é único que desbloqueia o Deep Think; nos Estados Unidos, seu custo varia entre US$ 100 e US$ 250 mensais, equivalente a aproximadamente R$ 495 a R$ 1.237 na cotação atual (sem incluir impostos brasileiros ou taxas adicionais).

Leia também:

YouTube implementa rótulo automático em vídeos identificando uso de IA
Google desafia OpenAI na competição por liderança em IA voltada ao consumidor
Nova busca do Google com IA abandona links tradicionais em favor de agentes inteligentes

Ativando o raciocínio estendido no aplicativo

Para quem deseja experimentar essa funcionalidade precisa acessar o seletor de modelos dentro do Gemini e localizar o menu referente ao nível de raciocínio na parte inferior da tela. A partir daí, basta alternar entre Standard e Extended conforme necessário.

A ampla liberação coincide com uma fase repleta de mudanças visíveis no Gemini, incluindo uma nova interface gráfica, um sistema temático que se adapta ao papel de parede do Android e os modelos Gemini 3.5 focados na eficiência. A proposta da Google é oferecer aos usuários maior controle sobre a relação entre velocidade e profundidade nas respostas fornecidas pela IA.

No entanto, vale ressaltar que essa capacidade refinada só será útil se acompanhada por consciência sobre os gastos envolvidos. Usar sempre o Extended pode resultar rapidamente no esgotamento da franquia semanal antes do esperado.

Para tarefas mais simples e rápidas, continuar utilizando o modo padrão continua sendo a alternativa mais sensata; já o raciocínio estendido se mostra vantajoso quando as perguntas envolvem múltiplas etapas ou comparações que necessitam desse tempo adicional para processamento eficiente por parte da máquina.