[{"jcr:title":"Projeto de iniciação científica avança em modelos de linguagem para facilitar a digitação por olhar","cq:tags_0":"area-de-conhecimento:ciência-da-computação","cq:tags_1":"area-de-conhecimento:tecnologia","cq:tags_2":"tipos-de-conteudo:pesquisa-na-graduação"},{"richText":"O trabalho do aluno Gustavo Valente, de Ciência da Computação, vencedor do 3º Simpósio de Iniciação Científica e Tecnológica entre projetos do PIBIC, aponta caminhos para melhorar a experiência dos usuários da tecnologia","authorDate":"03/02/2026 10h08","author":"Tiago Cordeiro","madeBy":"Por","tag":"tipos-de-conteudo:pesquisa-na-graduação","title":"Projeto de iniciação científica avança em modelos de linguagem para facilitar a digitação por olhar","variant":"imagecolor"},{"jcr:title":"transparente - turquesa - vermelho"},{"themeName":"transparente - turquesa - vermelho"},{"containerType":"containerTwo"},{"jcr:title":"Grid Container Section","layout":"responsiveGrid"},{"text":"Ao digitar na tela de um dispositivo eletrônico móvel, como um smartphone ou um tablet, a pessoa arrasta letras de um teclado virtual. E se fosse possível realizar a mesma atividade, utilizando o olhar? Não apenas o uso dos equipamentos ficaria mais ágil, como eles se tornariam acessíveis para pessoas com deficiências motoras severas. Existe uma linha de pesquisa que caminha a passos largos nessa direção. Ela se utiliza de duas áreas, interação humano-computador e aprendizagem computacional, para criar soluções capazes de viabilizar a digitação por olhar. Mas a experiência do usuário ainda precisa melhorar. “As pessoas que utilizam os sistemas disponíveis ainda encontram dificuldades. E, quando digitam errado, precisam recomeçar o processo”, relata Gustavo Valente, aluno de  [Ciência da Computação](https://www.insper.edu.br/pt/cursos/graduacao/ciencia-da-computacao)  do Insper. Nascido em Recife, ele tem 19 anos e em 2026 inicia o quinto semestre do curso. Em 2024, ainda no início da graduação, entrou em contato com o professor  [Andrew Kurauchi](https://www.linkedin.com/in/andrew-kurauchi-a8499115/?originalSubdomain=br) , que  [há anos pesquisa](https://www.insper.edu.br/pt/noticias/2021/11/-os-alunos-vao-ter-uma-primeira-experiencia-de-como-e-a-vida-de-)  métodos de comunicação para pessoas com deficiências motoras. O resultado dessa interação foi o projeto vencedor do  [3º Simpósio de Iniciação Científica e Tecnológica](https://www.insper.edu.br/pt/conteudos/acontece-no-insper/da-tecnologia-ao-direito-3-simposio-de-iniciacao-cientifica-e-tecnologica-destaca-a-diversidade-da-pesquisa-na-graduacao-do-insper)  com uma pesquisa para o Programa Institucional de Bolsas de Iniciação Científica ( [PIBIC](https://www.insper.edu.br/pt/pesquisa/pesquisa-na-graduacao/pibic) ): o  [trabalho](https://repositorio-api.insper.edu.br/server/api/core/bitstreams/c9f17451-8f69-4a39-8012-cb429958b798/content)  “LanGaze: Digitação por olhar potencializada por modelos de linguagem generativos” aprimorou um sistema de digitação por olhar que combina modelos de linguagem e decodificação de trajetórias oculares para tornar a interação mais precisa e natural – “LanGaze” é, como explica o relatório da pesquisa, “um método de decodificação de trajetórias oculares que integra um componente linguístico baseado em um modelo de linguagem à decodificação por tries [estruturas de dados] invertidas, com o intuito de melhorar a usabilidade de sistemas de digitação com o olhar”. Lição de casa em dia “Gustavo me procurou demonstrando interesse em realizar uma iniciação científica em aprendizagem computacional. Rapidamente ficou claro que ele tinha uma intuição matemática bastante apurada, então propus um projeto que unia os meus interesses de pesquisa com os dele”, afirma Kurauchi — que, em agosto de 2025, depois de oito anos no Insper, aceitou um novo desafio profissional e passou a atuar como engenheiro de software no Google; antes, além de orientar o trabalho de Valente, ele também acompanhou o projeto de Matheus Aguiar de Jesus, vencedor entre os trabalhos realizados no âmbito do Programa Institucional de Bolsas de Iniciação em Desenvolvimento Tecnológico e Inovação ( [PIBITI](https://www.insper.edu.br/pt/pesquisa/pesquisa-na-graduacao/pibiti) ). “O Gustavo teria que aprender muitas coisas por conta própria. Eu conseguiria apoiá-lo com a base conceitual de interação humano-computador, mas nós teríamos que aprender juntos o que fosse necessário sobre modelos de linguagem generativos”, prossegue o orientador. “Ele topou o desafio e trabalhou duro durante o projeto inteiro.” Para que a iniciativa fosse bem-sucedida, seria necessário aprender o suficiente sobre interação humano-computador e aprendizagem computacional, cada uma com seus requisitos teóricos, muitos deles ensinados em disciplinas que Valente ainda não havia cursado. “Ainda assim, a cada reunião o Gustavo me surpreendia com perguntas que mostravam que ele havia feito a sua lição de casa e muitas vezes ia além das minhas recomendações de leitura”, indica o professor.   Mudanças de rota Gustavo Valente optou pela graduação no Insper por encontrar na escola um modelo que o atraía desde o ensino médio. “Sempre fui envolvido com disciplinas científicas, como Física e Astronomia. Neste meio, falava-se muito em estudar em universidades fora do país para encontrar modelos em que o aluno tem maior liberdade e realiza mais atividades prática. Naturalmente, quando conheci o Insper, por intermédio de ex-alunos, essa se tornou minha primeira opção.” Depois de avaliar tudo o que já existia em pesquisas e avanços técnicos em digitação por olhar, ele e o professor identificaram que havia potencial para avançar na modelagem de linguagem. “Tivemos muitas mudanças de rotas, principalmente durante o início. Pensamos em diferentes formas de melhorar a experiência do usuário. A primeira foi gerar um banco de dados para treinar o modelo, mas a ideia se mostrou inviável por uma série de motivos técnicos. Precisamos pensar em alternativas”, relata o aluno. “Até chegar à proposta final apresentada no projeto, criamos três protótipos que acabaram não dando certo.”   Estrutura modular Como aponta o relatório final, assim como em abordagens anteriores, o sistema desenvolvido ao longo do projeto adota um framework baseado na tradução de trajetórias visuais em palavras a partir de um vocabulário estruturado em uma trie. Mas há um diferencial importante: “A principal diferença está na integração de um novo componente de modelagem de linguagem implementado por meio de um modelo de linguagem pré-treinado (LLM), que atua de forma complementar ao processo de alinhamento do gesto. Essa integração permitiu combinar, pela primeira vez, a estrutura clássica de decodificação de trajetórias visuais com a capacidade preditiva de um LLM, resultando em desempenhos promissores”. Com a vantagem adicional de que o componente de linguagem do LanGaze foi desenvolvido de maneira modular, o que implica que, à medida que modelos de linguagem mais sofisticados e leves se tornem disponíveis, eles poderão ser integrados ao decodificador sem a necessidade de alterar sua estrutura central. O trabalho pode ganhar continuidade, aponta Valente. “Por falta de tempo, não conseguimos colocar nosso codificador para as pessoas testarem, ainda que, nos testes internos, temos identificado que o modelo funciona. O próximo passo natural seria colocar para mais pessoas testarem e apresentarem feedbacks”. O professor concorda: “A solução tem potencial para resolver problemas bastante relevantes na digitação com o olhar. O próximo passo seria integrá-la a uma interface de digitação usando óculos de realidade virtual, e então realizar testes com usuários”.   "}]