Home › Forums › Fórum Classificação de Áudio com Python: O Guia Completo › Normalização dos dados acústicos, é obrigatória?
- This topic has 1 reply, 2 voices, and was last updated 3 years, 7 months ago by
Dalton Vargas.
- AuthorPosts
- 11 de outubro de 2022 at 18:07 #37307
Oi,
estava tentando rodar os modelos sem fazer a normalização dos dados com np.mean() pra ver se havia alguma diferença nos resultados. Mas quando eu tentei converter a lista de features para numpy ele deu o seguinte erro: could not broadcast input array from shape (40,28) into shape (40,). Pelo que eu entendi é porque as diferentes gravações têm tamanhos diferentes. Isso significa que na hora de entrar com os dados na rede daria problema, ou eu teria que padronizar o tamanho das matrizes de alguma forma, certo? O comum é fazer essa padronização e entrar com um vetor de uma dimensão só mesmo? Ou existem outras formas que vamos ver mais pra frente?
12 de outubro de 2022 at 08:49 #37312Olá Nelson!
Considerando a aplicação em MFCCs, o motivo de trabalharmos com a técnica de Normalização Média Cepstral (CMN – Cepstral Mean Normalization) é para reduzir o ruído e variações que ocorrem nos canais de cada arquivo de áudio, pois as condições do canal são diferentes para cada arquivo de áudio. Assim, cada recurso de áudio extraído é padronizado com sua própria média.
Antes de aplicar CMN:

Após aplicar CMN:

- AuthorPosts
- You must be logged in to reply to this topic.
