Home › Fóruns › Fórum Classificação de Áudio com Python: O Guia Completo › Reconhecimento de Fala › Responder a: Reconhecimento de Fala
Olá Cesar,
O conjunto de dados que você mencionou é o RAVDESS? Se sim, o ator neste dataset identifica se é homem ou mulher:
- Ator (01 a 24. Os atores com números ímpares são homens, os atores com números pares são mulheres).
Em resumo, a mudança que você precisa fazer utilizando o mesmo script da classificação de emoção, é definir o atributo ator como classe. Por exemplo:
X = np.array(extracted_features_df[‘feature’].tolist())
y = np.array(df.actors.tolist())
O restante do script permanece inalterado, exceto pela definição da estrutura da rede neural, onde sugiro que você experimente e ajuste conforme necessário. Pode ser que uma estrutura menos complexa seja suficiente, já que a classificação envolve apenas duas classes (feminino e masculino).