100333

PREDIÇÃO DE QUALIDADE DA DIETA COM SUPPORT VECTOR MACHINES

Favoritar este trabalho Entre em contato com os autores

Apresentação/Introdução
A avaliação da alimentação revela aspectos do hábito alimentar de indivíduos ou grupos, sendo possível realizar comparações ao longo do tempo. Embora pouco explorado na epidemiologia nutricional, a aplicação de Machine Learning em dados de consumo alimentar permite, uma vez treinado o modelo, a predição de qualidade da dieta.


Objetivos
Predizer qualidade da dieta em servidores públicos brasileiros com Support Vector Machines. Identificar acurácia, sensibilidade e especificidade do modelo.


Metodologia
O estudo analisou 4.935 servidores públicos entre 35 e 74 anos de idade, sendo 2.230 homens e 2.705 mulheres. A amostra foi constituída por servidores públicos que participaram da primeira onda do Estudo Longitudinal de Saúde do Adulto (ELSA-Brasil). Foram coletados dados demográficos, sociais e de saúde. Na linha de base do estudo foi aplicado um Questionário de Frequência Alimentar. As informações foram pré-processadas e o Índice de Qualidade da Dieta Revisado foi calculado. Finalmente, as predições foram realizadas com Support Vector Machines. A amostra foi dividida em subconjuntos de treino (70%) e de teste (30%). As análises incluíram feature selection e grid search.


Resultados
O modelo apresentou acurácia, sensibilidade e especificidade de 0.628, 0.8427 e 0.4291, respectivamente. Foram ajustados os seguintes parâmetros: kernel, cost e gamma. Após implementação de grid search e identificação dos melhores parâmetros, a acurácia obtida foi de 0.7117 na predição do maior e menor quintil do escore global de dieta. As cinco variáveis mais importantes identificadas pelo modelo foram: sexo, idade, tabagismo, aposentadoria e atividade física. Com exceção do relato de consumo álcool com as refeições e disponibilidade de vegetais próximos da residência, não foram incluídas no modelo variáveis de consumo alimentar.


Conclusões/Considerações
A divisão dos dados em conjuntos de treino e teste permitiu explorar a capacidade de Support Vector Machines na predição de quintis do escore de dieta. Na fase de teste, a classificação foi realizada sem que o algoritmo recebesse os rótulos cuja predição foi o objetivo, bem como sem ser exposto ao consumo alimentar dos participantes do estudo. As predições e identificação das classes foram cruzadas apenas para aferir acurácia do modelo.