Efficient-Unet : Um aprimoramento em modelos do tipo U-net

Vol 4 2021 - 136233
Trabalho
Favoritar este trabalho
Como citar esse trabalho?
Resumo

A aplicação de técnicas de inteligência artificial em imagens médicas está se tornando uma prática frequente na literatura, assim como também gradualmente no dia-a-dia dos hospitais. Em especial, o modelo Efficient-Unet está ganhando mais notoriedade na literatura e na prática (um exemplo está na incorporação deste modelo à biblioteca \textit{Tensorflow} do \textit{Python} a partir da versão 2.5.0), devido a sua maior eficiência em relação aos modelos convolucionais mais clássicos, principalmente comparando-se com a U-net. O trabalho da Eff-Unet demonstrou que a criação de um modelo que é mais equilibrado em largura, altura e resolução das camadas gera resultados mais precisos em um menor tempo computacional. Outra vantagem apresentada é que esse equilíbrio torna o modelo escalável em diversas problemas de segmentação. A nomenclatura Efficient-Unet vem utilização de uma Efficient-Net ao invés de uma resnet como encoder. De modo geral, tanto para a tarefa de segmentação de núcleos celulares quanto de vasos sanguíneos da retina, a Eff-Unet apresentou uma segmentação com maior acurácia e confiabilidade em menos épocas de treinamento quando comparado com o modelo U-net padrão.

Apoio/Financiamento da Pesquisa: SAE/UNICAMP

Questões (1 tópico)

Compartilhe suas ideias ou dúvidas com os autores!

Sabia que o maior estímulo no desenvolvimento científico e cultural é a curiosidade? Deixe seus questionamentos ou sugestões para o autor!

Faça login para interagir

Tem uma dúvida ou sugestão? Compartilhe seu feedback com os autores!

Autor

GABRIEL BORIN MACEDO

Bom dia Barbara o/.

Primeiramente, obrigado pelos elogios e pelas observações realizadas no resumo e vou responde-las.

a) A estrutura do texto ficou mais curta porque o resumo do relatório do PIBIC é bem limitado, então eu acabei querendo focar mais na entrega dos resultados. Mas concordo com você, ficou um pouco mais curto o texto. Vou passar aqui o link do github que postei os códigos e o relatório com mais detalhes : https://github.com/borin98/Efficient-Unet-Um-aprimoramento-em-modelos-do-tipo-U-net .

b) O meu trabalho na verdade propõe uma comparação de desempenho entre dois modelos que são U-net e Eff-Unet. Há vários trabalhos do uso da Eff-Unet em várias tarefas de segmentação. Inclusive, incrivelmente utilizam esse modelo de Eff-Unet para problemas que não são da área médica. Tem um paper que fala de uma aplicação de uma Eff-Unet em segmentação para segmentar objetos que estão na rua. Vou mandar o link aqui também : https://openaccess.thecvf.com/content_CVPRW_2020/papers/w22/Baheti_Eff-UNet_A_Novel_Architecture_for_Semantic_Segmentation_in_Unstructured_Environment_CVPRW_2020_paper.pdf .

c) As bases de dados foram escolhidas por 3 razões na verdade : A primeira é que o conjunto de dados de núcleos celulares do kaggle é um conjunto de dados bem conhecido na área de segmentação, pois a U-net se não me engano foi um dos modelos que mais apresentou melhores resultados e é mais simples de realizar a segmentação. A segunda razão da escolha do conjunto de dados da retina é que esse conjunto de dados é mais desafiador para realizar a segmentação. Por último, a implementação de ambos os códigos são bem similares. Então, aproveitei essa estrutura para realizar uma comparação de desempenho entre os dois modelos nesse conjunto de dados.

d) O que pretendia investigar é o desempenho de ambos os modelos na tarefa de segmentação nesses conjuntos de dados e analisar qual modelo apresenta um melhor desempenho neles.

e) Sobre esta parte, eu entrei mais detalhes sobre isso no meu relatório. Caso queira ver, sinta-se a vontade para entrar no github que coloquei na parte a) que está mais detalhado. Mas no geral, acredito que a diferença está na escala do valor do plot. Se você comparar as imagens, você vai perceber que os valores dos plots e mesmo das escalas variam para cada imagem. Mas, uma das teorias que tenho é que o modelo Eff-Unet é muito "profundo" para o problema. Ou seja, caso reduzisse o número de camadas, provavelmente ele apresentaria uma curva mais estável. Isso aconteceu pois queria reproduzir dois modelos que apresentam a mesma quantidade de neurônios e camadas para realizar os teste. Felizmente, o modelo Eff-Unet demonstrou uma segmentação de maior qualidade.

Bom, Caso tenha mais dúvidas, pode me escrever que responderei.

Obrigado pelas e perguntas e tenha um bom dia!

Instituições
  • 1 Unicamp
Eixo Temático
  • EXATAS
Palavras-chave
Segmentação de imagens
Imagens médicas
Redes neurais profundas