Funções de ativação: definição, características, e quando usar cada uma
Conheça o que são, para que servem, as características que devem ter boas funções de ativação, e quando usar cada uma.
Conheça o que são, para que servem, as características que devem ter boas funções de ativação, e quando usar cada uma.
O número de camadas escondidas depende da complexidade da relação entre as dimensões dos dados tratados, indo desde os casos lineares (que não precisam de camada escondida) até os casos que não podem ser descritos por equações (onde geralmente 2 camadas escondidas são suficientes). O número de neurônios é uma questão mais empírica, mas existem algumas sugestões para a abordagem inicial.
Neste post iremos finalizar a série sobre: “Como simular emoções em agentes?” Irei descrever como robôs considerados simples conseguem fazer com que pessoas percebam que esse agentes tenham emoções.
O BERT é um modelo que faz uso dos transformers para alcançar desempenhos inéditos em tarefas de processamento de linguagem natural.
Inteligência Artificial e robótica contra o coronavírus, veja neste post algumas ideias que podem ser utilizadas para lutarmos contra esse vírus e auxiliar no término dessa pandemia.
Neste segundo post da série como simular emoções em agentes, descrevo alguns robôs com recursos de última geração para simular esses sentimentos. Acredito que provavelmente você já tenhas visto algum deles, será? Clique nesse post e dá uma conferida.
Será que é possível um objeto como um agente robótico ter emoções? Leia este artigo e tire suas conclusões
Neste artigo você terá uma breve introdução à Computação Afetiva, que é uma área que utiliza conceitos da Computação e da Psicologia!
Neste artigo apresento como o conceito de atenção é implementado na estrutura do transformer, quais são as principais etapas que envolvem uma tarefa do tipo seq2seq nessa estrutura, e por que os transformers têm desbancado mesmo as versões mais recentes de RNNs.
Conheça o mecanismo de atenção, que é a base do transformer, a arquitetura de rede mais recente para PLN, e que permite que uma rede focalize em trechos específicos de uma sequência de dados para produzir resultados mais precisos.