IA alcança melhor desempenho na sumarização de livros inteiros recebendo feedback humano
O modelo foi treinado em um regime de aprendizado por reforço, utilizando o feedback humano como orientador. Este regime de treinamento, junto com o processamento do texto em trechos menores, permitiu que o sistema atingisse o melhor desempenho na tarefa até hoje.