Features_extractor no tópico Extração de Características MFCCs

Home Fóruns Fórum Classificação de Áudio com Python: O Guia Completo Features_extractor no tópico Extração de Características MFCCs

Visualizando 2 posts - 1 até 2 (de 2 do total)
  • Autor
    Posts
  • #35736
    Manuel
    Participante

      Olá pessoal, boa tarde!!

      Antes de mais nada, gostaria de parabenizar pelo ótimo conteúdo do curso de classificação de Áudio!!!

      Agora uma dúvida,  no item “Classificação de Sons Ambientais”, no tópico “Extração de Características MFCCs”, vocês ensinam uma função “features_extractor” que eu entendi que retorna uma média, ou seja, retorna um array de duas dimensões porém os valores praticamente estão em uma dimensão só (porque é feita a média).

      Queria saber com vocês porque não retornar o resultado todo, ao invés de retornar uma média? Existe alguma restrição a isso?

      Desde já agradeço muito e mais uma vez parabéns pelo conteúdo!

       

      #35739
      Dalton Vargas
      Moderador

        Olá Manuel!

        Muito obrigado pelo feedback!

        O motivo de trabalharmos com a técnica de Normalização Média Cepstral (CMN – Cepstral Mean Normalization) é para reduzir o ruído e variações que ocorrem nos canais de cada arquivo de áudio, pois as condições do canal são diferentes para cada arquivo de áudio. Assim, cada recurso de áudio extraído é padronizado com sua própria média.

        Antes de aplicar CMN:

        Antes de aplicar CMN

         

        Após aplicar CMN:

        Após aplicar CMN

      Visualizando 2 posts - 1 até 2 (de 2 do total)
      • Você deve fazer login para responder a este tópico.