Efficient-Unet : Um aprimoramento em modelos do tipo U-net

GABRIEL BORIN MACEDO; JOAO BATISTA FLORINDO

Efficient-Unet : Um aprimoramento em modelos do tipo U-net

Vol 4 2021 - 136233

Trabalho

Download

Como citar esse trabalho?

Resumo

A aplicação de técnicas de inteligência artificial em imagens médicas está se tornando uma prática frequente na literatura, assim como também gradualmente no dia-a-dia dos hospitais. Em especial, o modelo Efficient-Unet está ganhando mais notoriedade na literatura e na prática (um exemplo está na incorporação deste modelo à biblioteca \textit{Tensorflow} do \textit{Python} a partir da versão 2.5.0), devido a sua maior eficiência em relação aos modelos convolucionais mais clássicos, principalmente comparando-se com a U-net. O trabalho da Eff-Unet demonstrou que a criação de um modelo que é mais equilibrado em largura, altura e resolução das camadas gera resultados mais precisos em um menor tempo computacional. Outra vantagem apresentada é que esse equilíbrio torna o modelo escalável em diversas problemas de segmentação. A nomenclatura Efficient-Unet vem utilização de uma Efficient-Net ao invés de uma resnet como encoder. De modo geral, tanto para a tarefa de segmentação de núcleos celulares quanto de vasos sanguíneos da retina, a Eff-Unet apresentou uma segmentação com maior acurácia e confiabilidade em menos épocas de treinamento quando comparado com o modelo U-net padrão.

Apoio/Financiamento da Pesquisa: SAE/UNICAMP

Questões (1 tópico)

Outros 1

Sobre. o aprimoramento dos modelos do tipo U-net

Barbara Benato

Oi, Gabriel! Tudo bem?

Primeiramente, gostaria de parabenizá-lo pelo seu trabalho e seu resumo. O primeiro está intimamente ligado a uma área importante para a computação e de bastante relevância atualmente, principalmente no que diz a respeito a aplicações do mundo real e de imagens médicas utilizando estratégias de segmentação baseadas no aprendizado profundo. Sobre o segundo, seu resumo, destaco a fluidez na escrita. Contudo, fiquei com algumas dúvidas e gostaria também de saber mais sobre o trabalho.

a) Senti falta da estrutura do texto no resumo. Acredito que a estrutura o ajudaria e o guiaria na escrita, de forma a destacar pontos importantes, muitos daqueles que sanariam minhas dúvidas seguintes.

b) O seu trabalho propõe a criação e utilização da arquitetura Efficient-Unet pela primeira vez na literatura? Ou isso ja foi feito antes?

c) As bases de dados utilizadas no seu trabalho são provenientes de estudos anteriores com as mesmas arquiteturas? Algum motivo específico para elas terem sido escolhidas?

d) Onde você pretende chegar ou o que você pretende investigar com a avaliação das arquiteturas e bases de dados escolhidas?

e) Sobre os gráficos apresentados nas Figuras 1 e 3 (Eff-Unet), a distância entre as curvas de treino e validação tanto de acurácia, quanto para o custo, parece aumentar no final das iterações. A que você julga que se deve esse comportamento? O mesmo não parece acontecer para as Figuras 2 e 4 (Unet).

Agradeço desde já,

Bárbara

1 resposta

Autor

GABRIEL BORIN MACEDO

Bom dia Barbara o/.

Primeiramente, obrigado pelos elogios e pelas observações realizadas no resumo e vou responde-las.

a) A estrutura do texto ficou mais curta porque o resumo do relatório do PIBIC é bem limitado, então eu acabei querendo focar mais na entrega dos resultados. Mas concordo com você, ficou um pouco mais curto o texto. Vou passar aqui o link do github que postei os códigos e o relatório com mais detalhes : https://github.com/borin98/Efficient-Unet-Um-aprimoramento-em-modelos-do-tipo-U-net .

b) O meu trabalho na verdade propõe uma comparação de desempenho entre dois modelos que são U-net e Eff-Unet. Há vários trabalhos do uso da Eff-Unet em várias tarefas de segmentação. Inclusive, incrivelmente utilizam esse modelo de Eff-Unet para problemas que não são da área médica. Tem um paper que fala de uma aplicação de uma Eff-Unet em segmentação para segmentar objetos que estão na rua. Vou mandar o link aqui também : https://openaccess.thecvf.com/content_CVPRW_2020/papers/w22/Baheti_Eff-UNet_A_Novel_Architecture_for_Semantic_Segmentation_in_Unstructured_Environment_CVPRW_2020_paper.pdf .

c) As bases de dados foram escolhidas por 3 razões na verdade : A primeira é que o conjunto de dados de núcleos celulares do kaggle é um conjunto de dados bem conhecido na área de segmentação, pois a U-net se não me engano foi um dos modelos que mais apresentou melhores resultados e é mais simples de realizar a segmentação. A segunda razão da escolha do conjunto de dados da retina é que esse conjunto de dados é mais desafiador para realizar a segmentação. Por último, a implementação de ambos os códigos são bem similares. Então, aproveitei essa estrutura para realizar uma comparação de desempenho entre os dois modelos nesse conjunto de dados.

d) O que pretendia investigar é o desempenho de ambos os modelos na tarefa de segmentação nesses conjuntos de dados e analisar qual modelo apresenta um melhor desempenho neles.

e) Sobre esta parte, eu entrei mais detalhes sobre isso no meu relatório. Caso queira ver, sinta-se a vontade para entrar no github que coloquei na parte a) que está mais detalhado. Mas no geral, acredito que a diferença está na escala do valor do plot. Se você comparar as imagens, você vai perceber que os valores dos plots e mesmo das escalas variam para cada imagem. Mas, uma das teorias que tenho é que o modelo Eff-Unet é muito "profundo" para o problema. Ou seja, caso reduzisse o número de camadas, provavelmente ele apresentaria uma curva mais estável. Isso aconteceu pois queria reproduzir dois modelos que apresentam a mesma quantidade de neurônios e camadas para realizar os teste. Felizmente, o modelo Eff-Unet demonstrou uma segmentação de maior qualidade.

Bom, Caso tenha mais dúvidas, pode me escrever que responderei.

Obrigado pelas e perguntas e tenha um bom dia!

Instituições

¹ Unicamp

Eixo Temático

EXATAS

Palavras-chave

Segmentação de imagens

Imagens médicas

Redes neurais profundas

PIBIC 2021

Anais do Congresso de Iniciação Científica da Unicamp
XXIX Congresso de Iniciação Científica da UNICAMP

Efficient-Unet : Um aprimoramento em modelos do tipo U-net

Como citar esse trabalho?

Compartilhe suas ideias ou dúvidas com os autores!

Sobre. o aprimoramento dos modelos do tipo U-net

Discussões Científicas de Qualidade