Imagens intrínsecas são mapas de propriedades de superfícies, como profundidade, normal e albedo. Serão apresentados os resultados de experimentos simples que sugerem que preditores modernos muito bons de profundidade, normal e albedo são fortemente sensíveis à iluminação – se você iluminar uma cena de maneira razoável, a profundidade relatada mudará. Isso é intolerável. Para corrigir esse problema, precisamos ser capazes de produzir muitas iluminações diferentes da mesma cena. Será descrito um método para fazer isso. Primeiro, aprende-se um método para estimar albedo a partir de imagens sem nenhum dado rotulado (que, por sinal, apresenta bom desempenho em avaliações tradicionais). Em seguida, força-se um gerador de imagens a produzir várias imagens diferentes que tenham o mesmo albedo – com cuidado, essas são reiluminações da mesma cena.
Se um gerador de imagens pode reiluminar uma cena, ele provavelmente tem uma representação de profundidade, normal, albedo e outras propriedades úteis da cena em algum lugar. Será demonstrado evidências fortes de que profundidade, normal e albedo podem ser extraídos de dois tipos de geradores de imagem, com pouca dificuldade ou necessidade de dados de treinamento. Além disso, todos esses intrínsecos são muito menos sensíveis às mudanças de iluminação. Isso sugere que a maneira correta de obter imagens intrínsecas pode ser extraí-las de geradores de imagens. Também sugere que os geradores de imagens podem "saber" mais sobre a aparência da cena do que imaginamos.
Data/Hora
7 Out (Seg) • 15h00 - 16h30
Entrada
Rua Quatá, 300 - Vila Olímpia (Sala Sebastião Camargo - 1º andar)
Estacionamento
Rua Uberabinha, s/n - Vila Olímpia
Realização
Professor David Forsyth é o atual titular da cadeira Fulton-Watson-Copp em Ciência da Computação na Universidade de Illinois em Urbana-Champaign, para onde se mudou vindo da Universidade da Califórnia, Berkeley, onde também foi professor titular. Prof. Forsyth ocupa a cadeira Fulton-Watson-Copp em Ciência da Computação na Universidade de Illinois desde 2014. Já publicou mais de 170 artigos sobre visão computacional, computação gráfica e aprendizado de máquina. Foi copresidente do comitê de programa da IEEE Computer Vision and Pattern Recognition em 2000, 2011, 2018 e 2021, copresidente geral do CVPR em 2006 e 2015 e do ICCV em 2019, copresidente do comitê de programa da European Conference on Computer Vision em 2008, e é um membro regular do comitê de programa de todas as principais conferências internacionais sobre visão computacional. Foi membro do comitê de programa da SIGGRAPH por seis anos e um revisor regular dessa conferência. Recebeu prêmios de melhor artigo na Conferência Internacional de Visão Computacional e na Conferência Europeia de Visão Computacional. Recebeu um prêmio de Conquista Técnica da IEEE em 2005 por suas pesquisas. Tornou-se Fellow da IEEE em 2009 e Fellow da ACM em 2014. Seu livro didático, "Computer Vision: A Modern Approach" (em coautoria com J. Ponce e publicado pela Prentice Hall), é amplamente adotado como texto de curso (adoções incluem MIT, Universidade de Wisconsin-Madison, UIUC, Georgia Tech e UC Berkeley). Outro livro didático, "Probability and Statistics for Computer Science", está em circulação; e um terceiro ("Applied Machine Learning") acabou de ser publicado. Serviu por dois mandatos como Editor-Chefe da IEEE TPAMI. Participou também de vários conselhos consultivos científicos.