To cite this paper use one of the standards below:
A identificação do estilo musical a qual pertence uma música é uma tarefa relativamente simples para um humano, mesmo com pouco treinamento musical. Entretanto, é uma tarefa difícil a ser realizada de forma automatizada. Neste trabalho utilizamos a transformada Wavelet, que consegue representar uma música em suas componentes de frequência em função do tempo, gerando uma imagem denominada espectrograma. A partir dos espectrogramas, a Rede Neural Convolucional foi treinada com o objetivo de classificar os sinais de áudio de acordo com os seus estilos musicais. Foi utilizado apenas metade de cada sinal de áudio para gerar os espectrogramas, gerando um total de 6.075 músicas para treinamento e 2.025 para teste provenientes de 10 estilos musicais – Blues, Clássico, Country, Disco, Hip Hop, Jazz, Metal, Pop, Reggae e Rock. Os dados para treinamento e também para previsão foram escolhidos aleatoriamente em cada estilo musical para que fossem executadas 1000 épocas de treinamento, a medição foi repetida 10 vezes para cada estilo musical, deste modo garantindo o processo estocástico. A acurácia de treinamento obteve o melhor resultado com 90\% das imagens (8100) de aproximadamente 82\%. Os estilos Reggae, Jazz, Hiphop, Country, Classical e Blues obtiveram os seguintes melhores valores médios de previsões certas respectivamente: 94\%, 88\%, 82\%, 90\%, 91\% e 83\%.
With nearly 200,000 papers published, Galoá empowers scholars to share and discover cutting-edge research through our streamlined and accessible academic publishing platform.
Learn more about our products:
This proceedings is identified by a DOI , for use in citations or bibliographic references. Attention: this is not a DOI for the paper and as such cannot be used in Lattes to identify a particular work.
Check the link "How to cite" in the paper's page, to see how to properly cite the paper