Normalização dos dados acústicos, é obrigatória? | IA Expert Academy

Tagged: Estrutura da rede neural (Classificação de sons ambientais)

This topic has 1 reply, 2 voices, and was last updated 3 years, 9 months ago by Dalton Vargas.

Viewing 2 posts - 1 through 2 (of 2 total)

Author

Posts
11 de outubro de 2022 at 18:07 #37307
Nelson Buainain Neto
Participant
Oi,

estava tentando rodar os modelos sem fazer a normalização dos dados com np.mean() pra ver se havia alguma diferença nos resultados. Mas quando eu tentei converter a lista de features para numpy ele deu o seguinte erro: could not broadcast input array from shape (40,28) into shape (40,). Pelo que eu entendi é porque as diferentes gravações têm tamanhos diferentes. Isso significa que na hora de entrar com os dados na rede daria problema, ou eu teria que padronizar o tamanho das matrizes de alguma forma, certo? O comum é fazer essa padronização e entrar com um vetor de uma dimensão só mesmo? Ou existem outras formas que vamos ver mais pra frente?
12 de outubro de 2022 at 08:49 #37312
Dalton Vargas
Moderator
Olá Nelson!

Considerando a aplicação em MFCCs, o motivo de trabalharmos com a técnica de Normalização Média Cepstral (CMN – Cepstral Mean Normalization) é para reduzir o ruído e variações que ocorrem nos canais de cada arquivo de áudio, pois as condições do canal são diferentes para cada arquivo de áudio. Assim, cada recurso de áudio extraído é padronizado com sua própria média.

Antes de aplicar CMN:

Após aplicar CMN:
Author

Posts

Viewing 2 posts - 1 through 2 (of 2 total)

You must be logged in to reply to this topic.