Favoritar este trabalho
Como citar esse trabalho?
Resumo

Com o crescimento do ciberespaço, crescem também os danos causados por malwares, que são uma das principais ferramentas utilizadas por agentes maliciosos. Algoritmos de aprendizado de máquina vêm se consolidando como ferramentas importantes na detecção de ameaças. Modelos usados por esses algoritmos depende de dados para treinamento e teste. Nesse sentido, os conjuntos de dados de malware tornaram-se valiosos na implantação de sistemas anti-malwares modernos. No entanto, esses conjuntos de dados enfrentam problemas de qualidade das amostras, além de não acompanharem a velocidade da evolução tecnológica, tornando-se obsoletos. Além disso, muitos dos conjuntos de dados utilizados em pesquisas não são de acesso público. Este trabalho propõe uma estrutura de avaliação de qualidade baseada em métricas focadas na amostragem e na temporalidade dos dados. Ademais, incorpora critérios alinhados aos princípios FAIR, com o objetivo de incentivar a publicação de conjuntos de dados mais confiáveis e reutilizáveis.

Compartilhe suas ideias ou dúvidas com os autores!

Sabia que o maior estímulo no desenvolvimento científico e cultural é a curiosidade? Deixe seus questionamentos ou sugestões para o autor!

Faça login para interagir

Tem uma dúvida ou sugestão? Compartilhe seu feedback com os autores!

Instituições
  • 1 Instituto Militar de Engenharia (IME) e Diretoria de Comunicações e Tecnologia da Informação da Marinha (DCTIM)
  • 2 CASNAV
  • 3 Instituto Militar de Engenharia (IME)
  • 4 Universidade do Estado do Rio de Janeiro
  • 5 Universidade Federal Fluminense (UFF)
  • 6 University of Twente
Eixo Temático
  • 26. SE-PODMAR
Palavras-chave
conjuntos de dados
análise de malware
FAIR