SISTEMA DE APRENDIZADO POR REFORÇO AUTOMATIZADO COM MODELOS DE SUPERFÍCIE DE RESPOSTA APLICADO AO PROBLEMA DO CAIXEIRO VIAJANTE

Favoritar este trabalho
Como citar esse trabalho?
Detalhes
  • Tipo de apresentação: Pôster
  • Eixo temático: 11. IC – Inteligência Computacional
  • Palavras chaves: aprendizado por reforço; Problema do caixeiro viajante; automl;
  • 1 Universidade Federal do Recôncavo da Bahia

SISTEMA DE APRENDIZADO POR REFORÇO AUTOMATIZADO COM MODELOS DE SUPERFÍCIE DE RESPOSTA APLICADO AO PROBLEMA DO CAIXEIRO VIAJANTE

Gleice Kelly Barbosa Souza

Universidade Federal do Recôncavo da Bahia

Resumo

A Inteligência Artificial (IA) é um campo multidisciplinar com aplicabilidade nas mais diversas áreas. O Aprendizado de Máquina, em inglês, Machine Learning (ML), é um subcampo da IA que tem como objetivo permitir que sistemas inteligentes possam aprender e evoluir suas características. No entanto, um dos pontos críticos do ML é a definição dos parâmetros de aprendizado (exs.: taxa de aprendizado e número de neurônios de uma rede neural), que podem interferir significativamente no desempenho da tarefa. Nesse aspecto, o Aprendizado de Máquina Automatizado (AutoML) tem como intuito automatizar o processo de seleção de parâmetros adequados para cada situação ou conjunto de dados. Dessa forma, o objetivo deste trabalho é propor um sistema de AutoML para otimização dos parâmetros de um algoritmo de Aprendizado por Reforço (AR) aplicado ao Problema do Caixeiro Viajante. Para isso, foram utilizados modelos de regressão de segunda ordem da Metodologia de Superfície de Resposta (RSM). O trabalho apresenta avanços de estudos recentes, pois todo o processo passou a ser realizado em uma sequência automática de etapas em código desenvolvido em linguagem R: (i) realização de experimentos com várias combinações de parâmetros (taxa de aprendizado e fator de desconto) em instâncias da TSPLIB; (ii) ajuste dos modelos de RSM; (iii) análise das suposições de adequação dos modelos (significância e normalidade dos resíduos); (iv) definição dos parâmetros ótimos a partir dos pontos estacionários; (v) nova rodada de experimentos com a taxa de aprendizado e fator de desconto estimados. Assim, através do método de AutoML proposto, foi possível obter de forma automática os parâmetros de AR ajustados para cada problema simétrico da TSPLIB abordado. As simulações forneceram soluções (distância na rota) próximas aos valores ótimos disponibilizados pela TSPLIB.

Compartilhe suas ideias ou dúvidas com os autores!

Sabia que o maior estímulo no desenvolvimento científico e cultural é a curiosidade? Deixe seus questionamentos ou sugestões para o autor!

Faça login para interagir

Tem uma dúvida ou sugestão? Compartilhe seu feedback com os autores!