Features_extractor no tópico Extração de Características MFCCs | IA Expert Academy

Tagged: Treinamento da rede neural (Classificação de sons ambientais)

This topic has 1 reply, 2 voices, and was last updated 4 years ago by Dalton Vargas.

Viewing 2 posts - 1 through 2 (of 2 total)

Author

Posts
28 de junho de 2022 at 17:27 #35736
Manuel
Participant
Olá pessoal, boa tarde!!

Antes de mais nada, gostaria de parabenizar pelo ótimo conteúdo do curso de classificação de Áudio!!!

Agora uma dúvida, no item “Classificação de Sons Ambientais”, no tópico “Extração de Características MFCCs”, vocês ensinam uma função “features_extractor” que eu entendi que retorna uma média, ou seja, retorna um array de duas dimensões porém os valores praticamente estão em uma dimensão só (porque é feita a média).

Queria saber com vocês porque não retornar o resultado todo, ao invés de retornar uma média? Existe alguma restrição a isso?

Desde já agradeço muito e mais uma vez parabéns pelo conteúdo!
28 de junho de 2022 at 20:18 #35739
Dalton Vargas
Moderator
Olá Manuel!

Muito obrigado pelo feedback!

O motivo de trabalharmos com a técnica de Normalização Média Cepstral (CMN – Cepstral Mean Normalization) é para reduzir o ruído e variações que ocorrem nos canais de cada arquivo de áudio, pois as condições do canal são diferentes para cada arquivo de áudio. Assim, cada recurso de áudio extraído é padronizado com sua própria média.

Antes de aplicar CMN:

Após aplicar CMN:
Author

Posts

Viewing 2 posts - 1 through 2 (of 2 total)

You must be logged in to reply to this topic.