- This topic has 1 reply, 2 voices, and was last updated 3 years, 8 months ago by .
Viewing 2 posts - 1 through 2 (of 2 total)
Viewing 2 posts - 1 through 2 (of 2 total)
- You must be logged in to reply to this topic.
Home › Forums › Fórum Classificação de Áudio com Python: O Guia Completo › Normalização dos dados acústicos, é obrigatória?
Oi,
estava tentando rodar os modelos sem fazer a normalização dos dados com np.mean() pra ver se havia alguma diferença nos resultados. Mas quando eu tentei converter a lista de features para numpy ele deu o seguinte erro: could not broadcast input array from shape (40,28) into shape (40,). Pelo que eu entendi é porque as diferentes gravações têm tamanhos diferentes. Isso significa que na hora de entrar com os dados na rede daria problema, ou eu teria que padronizar o tamanho das matrizes de alguma forma, certo? O comum é fazer essa padronização e entrar com um vetor de uma dimensão só mesmo? Ou existem outras formas que vamos ver mais pra frente?
Olá Nelson!
Considerando a aplicação em MFCCs, o motivo de trabalharmos com a técnica de Normalização Média Cepstral (CMN – Cepstral Mean Normalization) é para reduzir o ruído e variações que ocorrem nos canais de cada arquivo de áudio, pois as condições do canal são diferentes para cada arquivo de áudio. Assim, cada recurso de áudio extraído é padronizado com sua própria média.
Antes de aplicar CMN:

Após aplicar CMN:
