A Nova Era do Raciocínio: Google DeepMind Lança o Gemini 2.5

Uma grande cabeça humana translúcida emergindo da água, com circuitos e interfaces tecnológicas dentro dela. Pequenos robôs humanoides estão trabalhando em plataformas ao seu redor, com cabos coloridos azuis e vermelhos conectando as estruturas. O fundo mostra um céu escuro com hologramas circulares tecnológicos flutuando acima da cabeça.

Na semana passada, a Google DeepMind anunciou o lançamento do Gemini 2.5, descrito como seu modelo de IA mais inteligente até o momento. O primeiro lançamento desta série é o Gemini 2.5 Pro Experimental, um modelo que já alcançou a posição de topo no ranking LMArena com uma margem significativa. Este benchmark mede as preferências humanas, indicando que o modelo não apenas tem bom desempenho técnico, mas também oferece respostas com um estilo de alta qualidade que os usuários preferem.

O que distingue o Gemini 2.5 é sua classificação como um “modelo pensante”, projetado para raciocinar antes de gerar respostas. Esta abordagem resulta em desempenho aprimorado e maior precisão ao abordar problemas complexos. O modelo demonstra capacidades excepcionais em tarefas desafiadoras, liderando em benchmarks de matemática e ciências como GPQA e AIME 2025, e pontuando 18,8% no Humanity’s Last Exam, um conjunto de dados criado por especialistas para testar a fronteira do conhecimento humano.

O Gemini 2.5 entra em um cenário cada vez mais competitivo de modelos de IA focados em raciocínio. O Claude 3.7 Sonnet da Anthropic, lançado em fevereiro de 2025, incorpora um modo de raciocínio dedicado que permite deliberação estendida sobre questões complexas. O GPT-4.5 da OpenAI, lançado no início de 2025, apresenta capacidades semelhantes, enfatizando a resolução de problemas passo a passo. Mais notavelmente, o modelo R1 da DeepSeek, lançado no final de 2024, foi pioneiro na implementação comercial de um framework de raciocínio recursivo que permite ao modelo refinar iterativamente seu próprio pensamento, demonstrando desempenho particularmente forte em tarefas de raciocínio matemático. Estes desenvolvimentos representam coletivamente uma mudança significativa na indústria de IA em direção a modelos que podem demonstrar mais explicitamente seus processos de raciocínio.

Além de suas capacidades de raciocínio, o Gemini 2.5 mantém a multimodalidade nativa e a extensa janela de contexto que caracterizaram as versões anteriores. Com uma janela de contexto de 1 milhão de tokens (com planos de expansão para 2 milhões), o modelo pode processar e compreender vastos conjuntos de dados de várias fontes de informação, incluindo texto, áudio, imagens, vídeo e repositórios inteiros de código. Esta base multimodal permite que ele lide com problemas complexos e suporte agentes mais capazes e conscientes do contexto.

O Gemini 2.5 Pro está atualmente disponível no Google AI Studio e no aplicativo Gemini para usuários do Gemini Advanced, com planos de trazê-lo para o Vertex AI em breve. A Google introduzirá preços nas próximas semanas para permitir o uso em produção em escala com limites de taxa mais altos.

Sobre o autor

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.