Gemini 1.5: nova versão da LLM do Google com maior janela de contexto
Além de ter qualidade similar ao Gemini 1.0 Ultra com performance superior, a versão Pro do Gemini 1.5 tem a maior janela de contexto já reportada para LLMs.
Além de ter qualidade similar ao Gemini 1.0 Ultra com performance superior, a versão Pro do Gemini 1.5 tem a maior janela de contexto já reportada para LLMs.
O Sora emprega uma arquitetura chamada de transformer de difusão para produzir vídeos de alta qualidade de até um minuto de duração, a partir de prompts de texto.
O modelo tem como grande novidade produzir sons e vozes, contextualizadas em um ambiente por exemplo, através de prompts de texto.
Apresentando melhorias significativas em relação ao seu antecessor, o Imagen 2, que já pode ser utilizado, emprega tecnologia de ponta para gerar imagens mais realistas.
Estudo sugere que, ao invés de apenas refletir padrões estatísticos presentes nos dados, os grandes modelos de linguagem constroem representações inernas do mundo.
IA usa autoaprendizagem para resolver problemas de geometria complexos
Ao tratar toda tarefa visual como geração de imagens, o modelo ganha habilidades generalistas assim como a IA generativa de texto.
Estudo destaca benefícios das visualizações multi-direcionais na classificação de cobertura terrestre crowdsourced usando aprendizado profundo.
O sistema identifica nuances acústicas próprias da doença para diagnosticar diabetes tipo 2 com trechos curtos de voz gravada em smartphone.
Essa descoberta revoluciona a ciência de materiais, com potencial para novas tecnologias, como baterias mais eficientes e eletrônicos mais poderosos.