AVALIAÇÃO DE QUALIDADE DE CONJUNTOS DE DADOS DE MALWARE PARA APRENDIZADO DE MÁQUINA

HERNANDEZ, Thaisa da Silva; NETO, Augusto Parisot de Gusmão; GANDOLFI, Caroline Duarte; BENTO, Lucila M. S.; MACHADO, Raphael C. S. Machado C. S.; SANTOS, Luiz Olavo Bonino da Silva; SANTOS, ANDERSON FERNANDES PEREIRA DOS; CAVALCANTI, Maria Cláudia Reis

AVALIAÇÃO DE QUALIDADE DE CONJUNTOS DE DADOS DE MALWARE PARA APRENDIZADO DE MÁQUINA

- 326182

Pôster

Download

Como citar esse trabalho?

Resumo

Com o crescimento do ciberespaço, crescem também os danos causados por malwares, que são uma das principais ferramentas utilizadas por agentes maliciosos. Algoritmos de aprendizado de máquina vêm se consolidando como ferramentas importantes na detecção de ameaças. Modelos usados por esses algoritmos depende de dados para treinamento e teste. Nesse sentido, os conjuntos de dados de malware tornaram-se valiosos na implantação de sistemas anti-malwares modernos. No entanto, esses conjuntos de dados enfrentam problemas de qualidade das amostras, além de não acompanharem a velocidade da evolução tecnológica, tornando-se obsoletos. Além disso, muitos dos conjuntos de dados utilizados em pesquisas não são de acesso público. Este trabalho propõe uma estrutura de avaliação de qualidade baseada em métricas focadas na amostragem e na temporalidade dos dados. Ademais, incorpora critérios alinhados aos princípios FAIR, com o objetivo de incentivar a publicação de conjuntos de dados mais confiáveis e reutilizáveis.

Programação

16:00 até 16:30 em 06/10/2025

Foyer Terreo

Instituições

¹ Instituto Militar de Engenharia (IME) e Diretoria de Comunicações e Tecnologia da Informação da Marinha (DCTIM)
² CASNAV
³ Instituto Militar de Engenharia (IME)
⁴ Universidade do Estado do Rio de Janeiro
⁵ Universidade Federal Fluminense (UFF)
⁶ University of Twente

Eixo Temático

26. SE-PODMAR

Palavras-chave

conjuntos de dados

análise de malware

FAIR

SBPO 2025

Anais do Simpósio Brasileiro de Pesquisa Operacional
Anais do LVII Simpósio Brasileiro de Pesquisa Operacional

AVALIAÇÃO DE QUALIDADE DE CONJUNTOS DE DADOS DE MALWARE PARA APRENDIZADO DE MÁQUINA

Como citar esse trabalho?

Compartilhe suas ideias ou dúvidas com os autores!

Discussões Científicas de Qualidade