Iniciativa permite às marcas extrair métricas, de acordo com o tempo de exposição, a quantidade de aparições e a localização do logotipo na tela
Tiago Cordeiro
Criar um protótipo para um sistema capaz de reconhecer marcas comerciais expostas em partidas de futebol. Com base nessas informações, extrair algumas métricas, como tempo de exposição da marca, quantidade de aparições, localização da marca na tela e tamanho do logotipo. Dessa forma, a empresa poderia avaliar, com mais assertividade, se o investimento realizado pela marca vem sendo efetivo.
Esse foi o desafio encarado por Gabriel Noal Oliva, José Fernando de Melo Cruz e João Pedro Montefeltro Junqueira Meirelles, alunos do curso de Engenharia de Computação. O trabalho “Reconhecimento e extração de marcas em vídeos de partidas de futebol” participou do evento de encerramento de mais uma edição do Projeto Final de Engenharia (PFE), disciplina integrada aos cursos das Engenharias Mecânica, Mecatrônica e de Computação do Insper. O PFE permite aos alunos aplicar seus conhecimentos, adquiridos durante o curso, a fim de contribuir no desenvolvimento de soluções inovadoras para desafios reais trazidos por empresas parceiras da escola.
No primeiro semestre, 12 alunos atuaram em projetos desenvolvidos no contexto do PFE para três empresas. “O projeto veio de dentro da Dell. Durante o desenvolvimento, fomos remodelando e projetando. Inicialmente era só uma aplicação simples que usaria machine learning, e no final virou um serviço em nuvem com processamento de imagem”, diz Meirelles, de 24 anos, aluno do último semestre do curso de Engenharia de Computação.
A iniciativa mostrou que é viável desenvolver um software que metrifica e reconhece marcas físicas em eventos esportivos, com boa acurácia. “Conseguimos verificar que é possível alcançar este objetivo com o serviço mantido em nuvem”, diz ele.
“Foi feito um primeiro passo para criar um protótipo para avaliar a viabilidade da solução. Ao longo do projeto, foram avaliados alguns possíveis modelos, sempre ponderando entre a complexidade computacional e a efetividade do método”, explica o orientador do grupo, Raul Ikeda, professor do Insper que nos últimos anos vem atuando em pesquisa na área de visão computacional e fusão de sensores para realizar navegação de sistemas autônomos.
“É um jogo onde se ganha desempenho, mas se necessita de recursos mais complexos, e vice-versa. Também surgiram os problemas usuais, como ajustes nos modelos utilizados, ou como lidar com cenários diversos, com grande diversidade de ambientes, tamanhos e perspectivas.”
Meirelles cita os principais desafios que os alunos encontraram ao longo do trabalho:
Para o futuro, diz Meirelles, é crucial implementar a performance em nuvem, provavelmente usando paralelismo em várias instâncias, além de criar um dashboard, com o objetivo de apresentar os resultados de forma visual. “Com essas duas melhorias, já seria possível disponibilizar uma primeira versão do aplicativo para uso”, diz o aluno.
O professor Ikeda indica os próximos passos: “Melhorar o sistema de desempenho em escala, permitindo processar grandes volumes de vídeos e em tempo real. Também é possível melhorar o modelo de detecção para identificar logotipos em superfícies maleáveis, como camisetas ou bandeiras”, ele aponta.
“Uma outra frente era cruzar dados sobre área efetiva onde os espectadores estão focando a visão e o mapa de calor de onde as marcas estão expostas”, ele completa. “Isso permitiria aos canais e marcas realizar ajustes para trazer maior visibilidade.”