Ao longo do processo de colonização da Amazônia, diferentes grupos indígenas foram reunidos em aldeias e vilas. Livres ou prisioneiros, passaram a conviver entre si a ponto de dar origem a uma espécie de língua geral, que se tornaria conhecida como Nheengatu. O idioma acabaria sendo proibido pela Coroa portuguesa no século 18, em um momento em que era utilizado por nativos e também por quem mais vivia na região. Desde então, entrou em processo de declínio. As estimativas variam, mas acredita-se que não mais do que 20 mil pessoas falem — e nem todos escrevam com frequência — Nheengatu, no Brasil, na Colômbia e na Venezuela.
Na tentativa de contribuir para a preservação da língua, a IBM e a Universidade de São Paulo (USP) vêm desenvolvendo um amplo programa de resgate e documentação, que gerou uma série de APIs, ou interfaces de programação de aplicações. Esse programa também engloba a modalidade escrita a língua, que é apoiada no alfabeto latino com a adição de outros cinco caracteres.
Mas era preciso agregar todas essas soluções em um aplicativo para Android, de forma que os falantes da língua pudessem incorporá-la ao dia a dia, especialmente na forma de mensagens de texto. Foi então que um grupo de alunos do Insper recebeu a missão de desenvolver um Capstone sobre este tema.
Como relatou Cláudio Pinhanez, cientista principal de pesquisador da IBM Research Brasil, durante o evento de apresentação dos projetos do segundo semestre de 2024, a participação dos alunos do Insper foi oportuna. “Estávamos fazendo um projeto muito grande com a USP de tecnologia para línguas indígenas brasileiras. Tínhamos desenvolvido uma série de aplicativos para a web, mas era preciso transpor para o Android em um momento que não tinha ninguém no meu time para isso.”
O Capstone “Desenvolvimento de aplicativo Android para facilitar a escrita em Nheengatu” foi realizado por Arthur Cisotto Machado e Vitor Irulegui Bueno Bandeira, alunos de Engenharia de Computação, além de Gustavo Antony de Assis e Gustavo Lindenberg Pacheco, da Ciência da Computação. Participaram ainda, à distância, dois estudantes de Engenharia Elétrica da Texas A&M University, Nicholas Petersilge e Samuel Koch.
A orientação ficou a cargo de Tiago Fernandes Tavares, professor de ciência de dados, álgebra linear e processamento de linguagem natural, que realiza pesquisas em processamento digital de sinais com machine learning em áreas como som, música e linguagens escritas.
A missão envolvia agregar diferentes serviços já desenvolvidos pela IBM, incluindo tradutores, dicionários completadores de palavras e corretores ortográficos, com o objetivo de criar uma ferramenta que auxilie a criação de textos curtos e médios por falantes de diversos níveis de Nheengatu. A empresa já desenvolveu, por exemplo, uma solução de tradução do idioma indígena para português e inglês. Tudo isso utilizando um conjunto de dados bastante restrito: a base de apoio utilizada pela companhia foi uma tradução da Bíblia para Nheengatu.
“A motivação desse amplo projeto de linguística computacional é que muitas línguas indígenas estão desaparecendo. Os jovens não têm interesse em aprendê-las. E, se o idioma vai embora, a cultura também se perde”, afirma o professor.
“Um dos objetivos é criar aplicações baseadas em inteligência artificial para o aprendizado e vitalização dessas línguas, principalmente para as novas gerações. O trabalho desenvolvido pelos alunos do Insper se realiza dentro deste contexto”, afirma Julio Nogima, pesquisador em Engenharia de Software da IBM e responsável pela mentoria técnica do projeto, que lembra que a IBM já tinha realizado experiências anteriores — e bem-sucedidas — com alunos do Insper.
Daí a iniciativa de agregar, em um único app, uma solução que chegasse aos celulares dos jovens nativos, sem desenvolver modelos de linguagem, processamento de dados linguísticos ou qualquer manipulação direta de informações sensíveis das comunidades indígenas. “Nesse contexto, garantir a melhor experiência do usuário era crucial. Trabalhamos com diferentes interfaces, e então avaliamos quantas vezes as pessoas erravam, quanto tempo demorava para realizar tarefas”, relata Tavares.
Com base em dados gerados por usuários voluntários, foi possível medir o desempenho de diferentes opções, diz o aluno Vitor Bandeira. “A capacidade de avaliar o desempenho da interface com base em dados nos levou a trabalhar de forma científica”, diz.
O feedback não foi coletado diretamente junto aos usuários finais, aos quais a equipe do Insper não teve acesso, já que a comunicação com as comunidades é conduzida pela IBM de forma bastante cautelosa. Apesar dessa limitação, a equipe conseguiu validar o projeto aplicando testes de usabilidade com voluntários do Insper, focando em aspectos da interface independentes do conhecimento da língua, e ciclos regulares de feedback com o mentor da IBM, que avaliou aspectos técnicos e culturais do sistema.
A Sala de Experiências de Usabilidade do Centro de Empreendedorismo (CEMP) do Insper se mostrou crucial nessa etapa, assim como as orientações do professor Marcelo Hashimoto, que tem experiência na área de experiência do usuário. “O apoio multidisciplinar do Insper nos levou além das nossas impressões pessoais e nos permitiu mensurar o resultado do trabalho”, aponta o estudante. Foram desenvolvidas seis versões até que a interface fosse considerada bem resolvida.
Posteriormente, é possível que o aplicativo seja disponibilizado em open source para uso em outros idiomas e contextos. Também está em estudos a possibilidade de permitir ao usuário inserir informações em outros formatos, como áudio, fotos e vídeo. A IBM vai coletar o feedback das comunidades. “Foi um projeto desafiador, que nos colocou em contato com uma demanda real, e o objetivo foi alcançado”, afirma Vitor Bandeira.
“Os objetivos propostos aos alunos foram plenamente alcançados. Os alunos trabalharam muito bem como um time e conseguiram implementar todas as funcionalidades requeridas pelo aplicativo. Eles se mostraram muito competentes e organizados, e responderam muito bem a todos os nossos feedbacks e solicitações”, diz Julio Nogima.
Ao longo do Capstone, os alunos conseguiram aprender a falar ou escrever Nheengatu? “Não, é muito difícil!”, responde o aluno. “Mas descobrimos e passamos a usar uma expressão, ‘purãga ara’, que é o equivalente a ‘bom dia’.”