dúvida sobre o nome do áudio

Visualizando 5 posts - 1 até 5 (de 5 do total)
  • Autor
    Posts
  • #46449
    julio filho
    Participante

      Bom dia , estou com uma base de dados no drive consigo fazer as classificações sendo que o nome não está igual a do freesound

      #46464
      Dalton Vargas
      Moderador

        Olá Julio,

        desculpe, mas não entendi completamente a sua dúvida. Você está perguntando como fazer a classificação quando os nomes das classes são diferentes (no caso de estar utilizando um dataset diferente da Urban8k)?

        Se for isso, a resposta é sim! É necessário ajustar alguns pontos no script para adaptar o modelo a um novo dataset. Segue abaixo onde você pode fazer essas modificações:

        Dicionário de Classes (sound_list ou equivalente):

        • verifique onde o dicionário de classes está definido no notebook
        • atualize os nomes das classes para refletir as categorias da nova base de dados
        • verifique se esses nomes correspondem exatamente aos metadados ou labels presentes na base

        Carregamento e organização dos Dados:

        • a UrbanSound8K usa arquivos organizados em diretórios por classe. Se sua nova base tem uma estrutura diferente (arquivos soltos ou outro tipo de metadados), ajuste a função de leitura para corresponder ao novo formato
        • modifique o caminho dos dados no script (se necessário) para apontar para a localização correta da nova base

        Pré-processamento de Áudio:

        • o script pode estar usando um formato específico (WAV). Confirme se a nova base utiliza o mesmo formato ou adapte o código para converter os arquivos de áudio (de MP3 para WAV).
        • verifique se os parâmetros de amostragem (sample rate) e duração dos clipes são compatíveis com os da nova base

         

        Extração de Features (MFCC ou outras):

        • bases diferentes podem demandar features específicas. Se a nova base exigir outra abordagem, ajuste a função de extração de MFCC ou adicione novos tipos de features, como espectrogramas ou Chroma

         

        Modelo e mapeamento das Classes:

        • ajuste a camada final do modelo (output layer) para o número correto de classes da nova base
        • se necessário, revise o label encoding para garantir que o mapeamento das classes esteja correto ao longo do pipeline

         

        Avaliação e métricas:

        • caso a nova base tenha desbalanceamento entre as classes, pode ser interessante incluir técnicas de balanceamento (class_weight ou oversampling)
        • revise as métricas utilizadas (accuracy pode não ser suficiente em casos de desbalanceamento)
        #46466
        julio filho
        Participante

          Bom dia , vou reformular , no código usamos dados da UrbanSound8K , nesses dados os áudios tem uma nomenclatura específica no qual a define como áudio de uma certa classe. No meu caso, eu tenho uma base de dados no google drive, na qual os diferentes áudios são separados por pastas, e cada pasta tem os tipos de áudios,e as nomenclatura é do tipo “audio_dia14”, com isso eu preciso treinar e classificar esses dados.

          #46467
          julio filho
          Participante

            Bom dia , vou reformular , no código usamos dados da UrbanSound8K , nesses dados os áudios tem uma nomenclatura específica no qual a define como áudio de uma certa classe. No meu caso, eu tenho uma base de dados no google drive, na qual os diferentes áudios são separados por pastas, e cada pasta tem os tipos de áudios, e as nomenclatura é do tipo “audio_dia14”, com isso eu preciso treinar e classificar esses dados.

            #46473
            Dalton Vargas
            Moderador

              ah beleza Julio,

              nesse caso é aquilo mesmo que expliquei na mensagem anterior.

            Visualizando 5 posts - 1 até 5 (de 5 do total)
            • Você deve fazer login para responder a este tópico.