Classificação de Áudio Musical a Partir dos Coeficientes da Transformada Wavelet Utilizando Redes Neurais Convolucionais

- 322206
Trabalho completo
Favoritar este trabalho
Como citar esse trabalho?
Resumo

A identificação do estilo musical a qual pertence uma música é uma tarefa relativamente simples para um humano, mesmo com pouco treinamento musical. Entretanto, é uma tarefa difícil a ser realizada de forma automatizada. Neste trabalho utilizamos a transformada Wavelet, que consegue representar uma música em suas componentes de frequência em função do tempo, gerando uma imagem denominada espectrograma. A partir dos espectrogramas, a Rede Neural Convolucional foi treinada com o objetivo de classificar os sinais de áudio de acordo com os seus estilos musicais. Foi utilizado apenas metade de cada sinal de áudio para gerar os espectrogramas, gerando um total de 6.075 músicas para treinamento e 2.025 para teste provenientes de 10 estilos musicais  – Blues, Clássico, Country, Disco, Hip Hop, Jazz, Metal, Pop, Reggae e Rock. Os dados para treinamento e também para previsão foram escolhidos aleatoriamente em cada estilo musical para que fossem executadas 1000 épocas de treinamento, a medição foi repetida 10 vezes para cada estilo musical, deste modo garantindo o processo estocástico. A acurácia de treinamento obteve o melhor resultado com 90\% das imagens (8100) de aproximadamente 82\%. Os estilos Reggae, Jazz, Hiphop, Country, Classical e Blues obtiveram os seguintes melhores valores médios de previsões certas respectivamente: 94\%, 88\%, 82\%, 90\%, 91\% e 83\%.

Compartilhe suas ideias ou dúvidas com os autores!

Sabia que o maior estímulo no desenvolvimento científico e cultural é a curiosidade? Deixe seus questionamentos ou sugestões para o autor!

Faça login para interagir

Tem uma dúvida ou sugestão? Compartilhe seu feedback com os autores!

Instituições
  • 1 Instituto Tecnológico de Aeronáutica
Eixo Temático
  • ST04 - Computação Gráfica e Matemática Discreta
Palavras-chave
Processamento de Sinais
MIR
Transformada Wavelet
Coeficientes Wavelet
Rede Neural Convolucional