- Este tópico contém 1 resposta, 2 vozes e foi atualizado pela última vez 2 anos, 9 meses atrás por .
Visualizando 2 posts - 1 até 2 (de 2 do total)
Visualizando 2 posts - 1 até 2 (de 2 do total)
- Você deve fazer login para responder a este tópico.
Home › Fóruns › Fórum Classificação de Áudio com Python: O Guia Completo › Features_extractor no tópico Extração de Características MFCCs
Olá pessoal, boa tarde!!
Antes de mais nada, gostaria de parabenizar pelo ótimo conteúdo do curso de classificação de Áudio!!!
Agora uma dúvida, no item “Classificação de Sons Ambientais”, no tópico “Extração de Características MFCCs”, vocês ensinam uma função “features_extractor” que eu entendi que retorna uma média, ou seja, retorna um array de duas dimensões porém os valores praticamente estão em uma dimensão só (porque é feita a média).
Queria saber com vocês porque não retornar o resultado todo, ao invés de retornar uma média? Existe alguma restrição a isso?
Desde já agradeço muito e mais uma vez parabéns pelo conteúdo!
Olá Manuel!
Muito obrigado pelo feedback!
O motivo de trabalharmos com a técnica de Normalização Média Cepstral (CMN – Cepstral Mean Normalization) é para reduzir o ruído e variações que ocorrem nos canais de cada arquivo de áudio, pois as condições do canal são diferentes para cada arquivo de áudio. Assim, cada recurso de áudio extraído é padronizado com sua própria média.
Antes de aplicar CMN:
Após aplicar CMN: