TSMixer: solução do Google une modelos lineares e redes neurais para previsões de séries temporais
Abordagem une modelos lineares univariados e transformer multivariados para previsões temporais excepcionais.
Abordagem une modelos lineares univariados e transformer multivariados para previsões temporais excepcionais.
A substituição da rede convolucional para processamento das imagens por um transformer gerou imagens mais realistas.
Neste artigo apresento como o conceito de atenção é implementado na estrutura do transformer, quais são as principais etapas que envolvem uma tarefa do tipo seq2seq nessa estrutura, e por que os transformers têm desbancado mesmo as versões mais recentes de RNNs.