O GPT-4 está entre nós
Além de ficar entre os 10% melhores colocados em um exame da ordem para humanos, a nova versão do GPT agora é capaz de analisar também imagens.
Além de ficar entre os 10% melhores colocados em um exame da ordem para humanos, a nova versão do GPT agora é capaz de analisar também imagens.
A estratégia que o modelo aplica envolve utilizar um modelo de linguagem pré-treinado para alimentá-lo com encodings de diferentes modais de informação, habilitando a inteligência artificial a executar tarefas que dependem do canal visual.
O método aplica o modelo Stable Diffusion para converter leituras de ressonância magnética funcional do cérebro nas imagens que uma pessoa estava vendo quando a atividade cerebral foi registrada.
O método usa princípios da aprendizagem por reforço para ajudar os modelos de linguagem a entender dados matemáticos apresentados como tabelas.
A sonda, que deve pousar na Lua no segundo trimestre, vai usar uma inteligência artificial para classificar o tipo de terreno e assim decidir por onde seguir em sua rota de exploração.
O sistema é treinado para otimizar em conjunto tanto a etapa de geração do conteúdo, em um ambiente simulado, quanto a etapa de planejamento da execução da pintura, gerando arte que mistura prompts de texto e imagens de referência mais parecidas com quadros pintados por pessoas.
A técnica usa um mesmo espaço de representação para que um conceito presente em um clipe de vídeo e um clipe de áudio possa ser codificado da mesma maneira, assim aproximando a tarefa de representar conceitos da forma humana.
A ferramenta adapta um modelo generativo de música para usar condicionamento por texto, produzindo novas músicas a partir de prompts com diferentes níveis de detalhamento.
O modelo usa um prompt de áudio e um prompt de texto para “transferir” a voz do áudio para o novo texto.
Os processadores gráficos vão proporcionar aumento de resolução para qualquer vídeo exibido em um navegador, desde resoluções tão baixas quanto 360p, o que vai incluir as plataformas de hospedagem de vídeos e os serviços de streaming.