dúvida sobre o nome do áudio

Tagged: Base de dados UrbanSound8K 1 (Classificação de sons ambientais)

This topic has 4 replies, 2 voices, and was last updated 1 year, 9 months ago by Dalton Vargas.

Viewing 5 posts - 1 through 5 (of 5 total)

Author

Posts
22 de outubro de 2024 at 10:42 #46449
julio filho
Participant
Bom dia , estou com uma base de dados no drive consigo fazer as classificações sendo que o nome não está igual a do freesound
23 de outubro de 2024 at 09:41 #46464
Dalton Vargas
Moderator
Olá Julio,

desculpe, mas não entendi completamente a sua dúvida. Você está perguntando como fazer a classificação quando os nomes das classes são diferentes (no caso de estar utilizando um dataset diferente da Urban8k)?

Se for isso, a resposta é sim! É necessário ajustar alguns pontos no script para adaptar o modelo a um novo dataset. Segue abaixo onde você pode fazer essas modificações:

Dicionário de Classes (sound_list ou equivalente):
- verifique onde o dicionário de classes está definido no notebook
- atualize os nomes das classes para refletir as categorias da nova base de dados
- verifique se esses nomes correspondem exatamente aos metadados ou labels presentes na base
Carregamento e organização dos Dados:
- a UrbanSound8K usa arquivos organizados em diretórios por classe. Se sua nova base tem uma estrutura diferente (arquivos soltos ou outro tipo de metadados), ajuste a função de leitura para corresponder ao novo formato
- modifique o caminho dos dados no script (se necessário) para apontar para a localização correta da nova base
Pré-processamento de Áudio:
- o script pode estar usando um formato específico (WAV). Confirme se a nova base utiliza o mesmo formato ou adapte o código para converter os arquivos de áudio (de MP3 para WAV).
- verifique se os parâmetros de amostragem (sample rate) e duração dos clipes são compatíveis com os da nova base
Extração de Features (MFCC ou outras):
- bases diferentes podem demandar features específicas. Se a nova base exigir outra abordagem, ajuste a função de extração de MFCC ou adicione novos tipos de features, como espectrogramas ou Chroma
Modelo e mapeamento das Classes:
- ajuste a camada final do modelo (output layer) para o número correto de classes da nova base
- se necessário, revise o label encoding para garantir que o mapeamento das classes esteja correto ao longo do pipeline
Avaliação e métricas:
- caso a nova base tenha desbalanceamento entre as classes, pode ser interessante incluir técnicas de balanceamento (class_weight ou oversampling)
- revise as métricas utilizadas (accuracy pode não ser suficiente em casos de desbalanceamento)
23 de outubro de 2024 at 10:32 #46466
julio filho
Participant
Bom dia , vou reformular , no código usamos dados da UrbanSound8K , nesses dados os áudios tem uma nomenclatura específica no qual a define como áudio de uma certa classe. No meu caso, eu tenho uma base de dados no google drive, na qual os diferentes áudios são separados por pastas, e cada pasta tem os tipos de áudios,e as nomenclatura é do tipo “audio_dia14”, com isso eu preciso treinar e classificar esses dados.
23 de outubro de 2024 at 10:32 #46467
julio filho
Participant
Bom dia , vou reformular , no código usamos dados da UrbanSound8K , nesses dados os áudios tem uma nomenclatura específica no qual a define como áudio de uma certa classe. No meu caso, eu tenho uma base de dados no google drive, na qual os diferentes áudios são separados por pastas, e cada pasta tem os tipos de áudios, e as nomenclatura é do tipo “audio_dia14”, com isso eu preciso treinar e classificar esses dados.
24 de outubro de 2024 at 08:52 #46473
Dalton Vargas
Moderator
ah beleza Julio,

nesse caso é aquilo mesmo que expliquei na mensagem anterior.
Author

Posts

Viewing 5 posts - 1 through 5 (of 5 total)

You must be logged in to reply to this topic.