Google I/O 2024 apresenta novidades da empresa na inteligência artificial

Depois da OpenAI anunciar o GPT-4o, foi a vez do Google apresentar seus avanços em inteligência artificial. No seu evento anual Google I/O, no último dia 14, a empresa expos seu panorama atual e o impacto em seus produtos.

O modelo Gemini tem sido o grande foco do Google. Ele já está trazendo mudanças significativas na forma como os usuários interagem com a informação. Desde sua concepção, o Gemini foi proposto como um recurso multimodal. Isso significa que ele pode entender e responder a informações apresentadas em vários formatos, incluindo texto, imagens, vídeo e código. Além disso, o Gemini pode analisar grandes quantidades de informações simultaneamente, permitindo que ele lide com tarefas complexas e responda a perguntas intrincadas. Por exemplo, um usuário pode enviar uma consulta de pesquisa junto com uma imagem ou um texto extenso, e o Gemini é capaz de analisar páginas da web, vídeos e trechos de código relevantes para fornecer uma resposta abrangente.

Essa integração do Gemini está tendo um impacto positivo na experiência do usuário em vários produtos do Google. A Pesquisa Google, por exemplo, que é o principal produto da empresa, está passando por uma grande transformação. Pesquisas simples por palavra-chave estão se tornando obsoletas. O Gemini agora pode decifrar consultas complexas, mesmo aquelas que incorporam imagens ou longos trechos de texto. Ao se aprofundar em uma vasta quantidade de informações, ele fornece os resultados mais relevantes e informativos.

Outro exemplo é o novo recurso Ask Photos, que deve ser integrado ao álbum virtual Photos. Ele elimina a tarefa tediosa de procurar por anos de fotos em sua biblioteca. O Ask Photos permite que os usuários pesquisem usando linguagem natural. Imagine querer encontrar uma foto específica da festa de aniversário da sua filha no ano passado. O Ask Photos pode identificar objetos e cenas dentro de suas fotos, tornando-as facilmente pesquisáveis.

Da mesma forma, a integração do Gemini com o Gmail agiliza a recuperação e compreensão de informações dentro do pacote Workspace. Os usuários agora podem pesquisar em todos os seus e-mails de trabalho e receber resumos dos pontos principais em um instante, ou solicitar resumos de longas gravações de reuniões. Esse recurso permite que os usuários sejam mais produtivos no trabalho.

O Google está expandindo ativamente os recursos e a acessibilidade do Gemini. Os desenvolvedores agora têm acesso a várias versões, incluindo uma opção leve, o Gemini 1.5 Flash, para tarefas mais rápidas e econômicas. Isso garante que o poder do Gemini possa ser aproveitado para uma ampla gama de aplicações.

Para fazer frente ao recurso conversacional apresentado pela OpenAI, o Google apresentou o Live, seu assistente pessoal capaz de conversar em tempo real. Além disso, o Gemini vai passar a ser disponível em smartphones com o sistema Android, substituindo o assistente tradicional do sistema operacional. Os aparelhos vão consumir o modelo Gemini Nano com multimodalidade, que mantém as informações privadas do usuário no aparelho.

Muitas outras novidades foram anunciadas, como a visão da empresa para agentes dotados de inteligência artificial e novo hardware para atualizar a infraestrutura necessária para treinar e disponibilizar modelos cada vez mais potentes. Mais detalhes podem ser encontrados no blog da empresa.

Sobre o autor

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.