- Este tópico contém 1 resposta, 2 vozes e foi atualizado pela última vez 2 anos, 5 meses atrás por .
Visualizando 2 posts - 1 até 2 (de 2 do total)
Visualizando 2 posts - 1 até 2 (de 2 do total)
- Você deve fazer login para responder a este tópico.
Home › Fóruns › Fórum Classificação de Áudio com Python: O Guia Completo › Normalização dos dados acústicos, é obrigatória?
Oi,
estava tentando rodar os modelos sem fazer a normalização dos dados com np.mean() pra ver se havia alguma diferença nos resultados. Mas quando eu tentei converter a lista de features para numpy ele deu o seguinte erro: could not broadcast input array from shape (40,28) into shape (40,). Pelo que eu entendi é porque as diferentes gravações têm tamanhos diferentes. Isso significa que na hora de entrar com os dados na rede daria problema, ou eu teria que padronizar o tamanho das matrizes de alguma forma, certo? O comum é fazer essa padronização e entrar com um vetor de uma dimensão só mesmo? Ou existem outras formas que vamos ver mais pra frente?
Olá Nelson!
Considerando a aplicação em MFCCs, o motivo de trabalharmos com a técnica de Normalização Média Cepstral (CMN – Cepstral Mean Normalization) é para reduzir o ruído e variações que ocorrem nos canais de cada arquivo de áudio, pois as condições do canal são diferentes para cada arquivo de áudio. Assim, cada recurso de áudio extraído é padronizado com sua própria média.
Antes de aplicar CMN:
Após aplicar CMN: