ARGILOCLAY-ROBO: APLICAÇÃO RETRIEVAL-AUGMENTED GENERATION PARA INDEXAÇÃO DE DADOS DE PESQUISA SOBRE ARGILAS E ARGILOMINERAIS

- 328954
Resumo regular (Pôster)
Favoritar este trabalho
Como citar esse trabalho?
Resumo

Introdução e Objetivos: A crescente complexidade e volume dos dados digitais nas Geociências, especialmente nos estudos sobre argilas e argilominerais, demanda soluções computacionais que promovam reprodutibilidade, acesso aberto e automação analítica. Neste cenário, o presente estudo desenvolve o ArgiloClay-ROBO, uma aplicação computacional em Python concebida para efetuar a leitura, inferência e interpretação automatizada de dados geoquímicos relacionados a argilas e argilominerais. Com ênfase em coleções científicas e dados de pesquisas obtidas por meio de técnicas analíticas, tais como Difratometria de raios-x (DRX), espectroscopia Raman, espectroscopia no Infravermelho por Transformada de Fourier (FTIR), termogravimetria (TGA), Microssonda Eletrônica (EPMA) e Microscopia Eletrônica de Varredura (MEV). Método: O sistema baseia-se na arquitetura Retrieval-Augmented Generation (RAG), utilizando o modelo de linguagem LLaMA 3.2, operando localmente via o servidor Ollama, com embeddings do llama-index e interface interativa desenvolvida em Gradio. Os dados são armazenados e estruturados em um repositório construído com o framework InvenioRDM, que permite a extração automatizada de metadados Dublin Core e campos estendidos específicos sobre argilas e argilominerais. A indexação semântica e os mecanismos de consulta em linguagem natural foram configurados para responder com base no conteúdo textual e nos metadados dos documentos. A avaliação do sistema seguiu uma abordagem quantitativa e qualitativa, com foco em três dimensões principais: relevância da resposta, exatidão factual e abrangência informacional. Esses critérios foram aplicados em um conjunto de testes utilizando um corpus real composto por 100 documentos científicos em diversos formatos (PDF, CSV, DOCX), totalizando cerca de 1000 páginas. Resultados e Discussão: A indexação semântica foi concluída com sucesso, e os testes de recuperação evidenciaram precisão contextual superior a 33% nas respostas às consultas em linguagem natural, considerando avaliação manual por especialistas quanto à relevância das respostas. O tempo médio de resposta foi de 12,3 segundos por consulta, com estabilidade confirmada após 100 interações sucessivas. A interface Gradio apresentou desempenho satisfatório, com usabilidade avaliada positivamente por usuários em testes de uso supervisionado. Entre os resultados, destaca-se a capacidade do sistema de localizar trechos descritivos sobre tipos de argilominerais específicos (ex. presença de esmectita e sua composição química) com base em perguntas abertas, além de identificar documentos correlacionados por similaridade semântica. Conclusões: Os resultados obtidos demonstram a viabilidade técnica e científica do sistema ArgiloClay-ROBO como uma plataforma inovadora para análise, interpretação e inferência a partir de dados de pesquisa. A integração entre inteligência artificial, repositórios digitais e métodos de análise permitiu avanços significativos na automatização da identificação e caracterização mineralógica de argilas e argilominerais e no suporte à pesquisa aplicada. O sistema contribui para a democratização do acesso a dados científicos de alta complexidade, promovendo o uso de tecnologias abertas e reprodutíveis. As perspectivas futuras incluem a ampliação da base de dados com novas amostras, o treinamento contínuo do modelo com feedback dos usuários e a integração com redes nacionais e internacionais de repositórios de dados científicos.

Compartilhe suas ideias ou dúvidas com os autores!

Sabia que o maior estímulo no desenvolvimento científico e cultural é a curiosidade? Deixe seus questionamentos ou sugestões para o autor!

Faça login para interagir

Tem uma dúvida ou sugestão? Compartilhe seu feedback com os autores!

Instituições
  • 1 Universidade Federal do Rio Grande do Sul
  • 2 INSTITUTO DE GEOCIÊNCIAS, UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL, PORTO ALEGRE, RS
Eixo Temático
  • ST-11 - Mineração de Dados & Inteligência Artificial
Palavras-chave
RAG
PYTHON
ARGILAS
ARGILOMINERAIS
BANCO DE DADOS