Primeiramente, parabéns pelo trabalho. O texto está muito bem escrito e demonstra domínio sobre o tema. Gostaria de colocar algumas questões.
1) Você poderia explicar como é a função de ativação selu, quais suas vantagens em relação a outras funções de ativações mais corriqueiras, como relu, tanh, sigmoide? Diferentes ativações foram testadas?
2) Você poderia me explicar brevemente como funciona o otimizador RMSprop?
3) Alguma técnica de regularização foi utilizada? Ou essas redes já são robustas a problemas de overfitting?
4) Você poderia explicar com mais detalhes como é a técnica de minibatch discrimination?
5) Não entendi muito bem como funciona a AAE, a rede discriminadora vai tentar dizer se a imagem codificada foi gerada a partir de uma imagem real? Nesse caso, como você gera as imagens codificadas artificiais, que a discriminadora deve identificar como 'não reais'? Você poderia me explicar com mais detalhes?
6) Na Figura 7, parece-me que a AAE gerou sempre a mesma saída, para qualquer entrada da rede, por que você acha que isso ocorreu? O que você acha que poderia alterar nos hiperparâmetros, ou no treinamento da AAE para que ela produzisse resultados mais razoáveis para este problema da LSUN:Bedroom?
7) O ganho de desempenho dos classificadores apresentados nas Tabelas 1 e 2 são relativos ao problema final? Quer dizer, a rede generativa foi usada para aumentar o conjunto de treino dos classificadores, e então o desempenho desses classificadores foi avaliado em relação a um conjunto de validação/teste composto somente por dados reais?