Quatro alunos do Insper trabalham em uma solução de edge computing para melhorar a mobilidade de pessoas cegas ou com baixa visão
Os futuros alunos do curso de Ciência da Computação do Insper podem ter uma ideia do tipo de aprendizado prático oferecido pela escola observando os seus colegas da Engenharia de Computação, um curso voltado mais para o hardware, mas que também exige conhecimento da linguagem de programação. Um exemplo é o projeto que está sendo desenvolvido por um grupo de alunos do 8º semestre com o objetivo de desenvolver um software de detecção de imagens para um dispositivo que pretende melhorar a mobilidade de pessoas com deficiência visual.
Os alunos Gabriela Iannini Caruso, Pedro Paulo Mendonça Telho, Pedro Vero Fontes e Rafael Alves de Mello Almada estão trabalhando em uma solução de edge computing embarcada para auxiliar pessoas com deficiência visual a realizar tarefas diárias, como fazer compras em um mercado, realizar pedidos em um restaurante ou atravessar avenidas movimentadas sem a ajuda de um cão-guia. A edge computing, ou computação de borda, é uma tecnologia que permite o processamento, a análise e o armazenamento de dados mais próximos de onde eles são gerados, possibilitando respostas mais rápidas. A edge computing usa um conceito distinto da tecnologia de cloud computing, ou computação em nuvem, que permite o uso de recursos computacionais de modo remoto a partir da conexão com a internet.
O software desenvolvido pelos alunos do Insper vai ser usado em um produto idealizado por um cliente, Kamal Sarkar, professor da Universidade do Texas Rio Grande Valley (UTRGV). Sarkar forneceu um protótipo do equipamento, uma espécie de colete que a pessoa com deficiência visual veste e que contém todo o hardware, incluindo um microprocessador e câmeras, além de uma bengala de condução equipada com sensores. As câmeras captam as imagens ao redor e o software as identifica para a pessoa, por meio de um modelo de aprendizado de máquina. “O nosso software analisa 30 imagens por segundo e traduz o que está vendo quando tem mais de 90% de certeza. Se ele vê, por exemplo, um carro e tem mais de 90% de certeza de que se trata mesmo de um carro, ele avisa a pessoa pelo fone de ouvido”, explica o aluno Pedro Vero Fontes.
Além desse modo-padrão de funcionamento, batizado de Safari, os alunos estão desenvolvendo um segundo modo, chamado Query, para responder às consultas do usuário. “A pessoa poderá apertar um botão e fazer uma pergunta específica, como ‘Onde está a maçã?’, e utilizamos uma técnica de transfer learning para procurar esse item”, diz o aluno Rafael Alves de Mello Almada. A transfer learning, ou aprendizagem por transferência, é uma forma de usar o conhecimento adquirido na resolução de um problema para solucionar um problema diferente, mas relacionado. Por exemplo, o conhecimento adquirido ao aprender a reconhecer carros pode ser usado para reconhecer caminhões. Por ser um processo computacionalmente mais caro, o modo Query deve ser aplicado inicialmente no produto somente para reconhecer alimentos ou objetos encontrados tipicamente em um campus universitário.
No Brasil, segundo dados do IBGE, há mais de 6,5 milhões de pessoas cegas ou com alguma deficiência visual, ou 3,4% da população. Para entender melhor o perfil do público-alvo, a aluna Gabriela Iannini Caruso conduziu entrevistas com um grupo de pessoas com deficiência visual, para entender a rotina e as principais dificuldades enfrentadas por elas no cotidiano — um dos principais problemas relatados é esbarrar em coisas que não estão no chão e, por isso, não são detectadas pelas bengalas. Especialistas da Fundação Dorina Nowill para Cegos, uma organização sem fins lucrativos que se dedica à inclusão social de pessoas cegas e com baixa visão, também contribuíram com informações.
Com base nas entrevistas, os estudantes mapearam dois perfis de pessoas com deficiência visual: as que já nasceram cegas e as que perderam a visão gradualmente. “Em geral, as que perderam a visão quando adultas têm mais dificuldade de enfrentar as situações do dia a dia. Acreditamos que o nosso produto poderá ser especialmente útil para essas pessoas”, diz o aluno Pedro Paulo Mendonça Telho. Segundo ele, muita gente evita ir a um supermercado por não conseguir ler os rótulos dos produtos nas gôndolas. “Estamos vendo a possibilidade de o nosso software fazer também o reconhecimento de texto. Isso facilitaria bastante a vida dessas pessoas.”
Um produto que já existe no mercado para auxiliar pessoas com deficiência visual é o Orcam MyEye, fabricado por uma empresa israelense. Trata-se de um dispositivo de visão artificial com uma câmera inteligente, pesando apenas 22,5 gramas e que pode ser fixado na haste dos óculos. O aparelho lê textos e reconhece rostos e objetos. O problema é seu preço elevado, cerca de 4.000 dólares, e baterias que duram em torno de 1 hora. O produto que os alunos dos Insper estão ajudando a desenvolver deverá ter um custo bem mais acessível (o teto estabelecido pelo cliente é de 1.000 dólares), além de baterias com duração mínima de 9 horas.
Para os alunos, um produto como esse tem grande potencial de fazer a diferença na vida de muitas pessoas. Além disso, o projeto dá aos estudantes a oportunidade de colocarem em prática muito do que aprendem na sala de aula. “É um projeto que abrange quase todas as matérias de computação. Tem um pouco de cloud, de computação embarcada, de machine learning, de redes neurais, de ciência dos dados. E temos que pesquisar também muita coisa fora da escola”, diz Rafael Almada.
Os estudantes conversam semanalmente com o cliente, que acompanha o progresso de tudo, faz sugestões e aprova as entregas periódicas. Os alunos também realizam duas reuniões semanais com o orientador do projeto, o professor Fabio de Miranda. “A importância de um projeto como esse é ajudar a levar os avanços da tecnologia para pessoas que têm necessidades. Os alunos aprendem na prática que na origem do problema alguém tem uma demanda que precisa ser atendida”, diz Miranda. “Saber construir a solução com os clientes e usuários é tão importante quando saber teorias avançadas.”
Atualmente, cerca de 80% do trabalho já está pronto. A meta dos alunos é concluir tudo até a primeira semana de dezembro.