25/10/2022
Profissionais de diferentes setores apresentaram o potencial da computação na Semana de Ciência de Dados e Engenharia do Insper
Leandro Steiw
As imensas possibilidades da ciência de dados nas áreas de pesquisa, inovação e desenvolvimento de negócios foram apresentadas na Semana de Ciência de Dados e Engenharia do Insper, realizada nos dias 17 a 21 de outubro. Sistema financeiro, medicina e saúde, bioengenharia, varejo e governança de dados científicos são mercados potenciais para os futuros engenheiros e cientistas da computação.
Os usuários do sistema de saúde podem ser beneficiados pela implementação de ferramentas que acompanhem o histórico médico dos pacientes. Professora e pesquisadora na University of St. Andrews, no Reino Unido, Juliana Küster Filipe Bowles falou sobre o Learning Health Systems, os sistemas de saúde de aprendizagem. Trata-se de usar anos e anos de informações de diversos pacientes para alimentar um software que oriente as prescrições de tratamentos e medicamentos pelos médicos. Mas um processo simples e confiável ainda segue sendo um desafio para os engenheiros e cientistas de dados britânicos.
Uma das barreiras é que não há um padrão de tratamento dos dados, que varia de país para país e, às vezes, de estado para estado. Mesmo na Comunidade Europeia, os sistemas de saúde não se conectam. Também faltam interoperabilidade e integração dos sistemas. Outro limitante é que os médicos não acessam a ferramenta em tempo real, mas só depois de submeterem uma consulta a um banco de dados centralizado. Na experiência britânica, não se definiu ainda como integrar a inteligência artificial para produzir modelos preditivos de tratamento.
Segundo Juliana Bowles, esses são apenas aspectos técnicos. Considerando que se consiga montar um banco de dados ideal, de acesso instantâneo, existem várias questões relacionadas ao uso dessas informações: risco de confidencialidade do paciente, autorização de acesso aos profissionais de saúde, combinação de estatísticas e ausência de certos medicamentos em algumas regiões, entre outros. “Ou seja, nesta questão, há o lado humano e o lado da ciência de dados para resolver. Os pacientes precisam ser convencidos de que compartilhar informações pessoais será bom para o sistema e o tratamento de saúde”, disse Juliana.
No mesmo âmbito da saúde, o cientista de dados pode ter uma visão mais holística e compassiva, na opinião de Josh Morgan, diretor nacional de saúde comportamental e atenção integral à pessoa do SAS, plataforma de análise de dados. “O desafio em saúde comportamental é mudar a percepção das pessoas de que todas as pessoas com problemas de saúde comportamental são loucos”, disse Morgan. Ele propõe ao cientista olhar os dados de forma diferente, na direção de oito dimensões de bem-estar: emocional, espiritual, intelectual, físico, ambiental, financeiro, ocupacional e social. Os dados podem ajudar a humanizar as pessoas, reduzindo estigmas e discriminação, se as respostas do sistema não se centrarem apenas em custos e burocracia.
No painel “Carreiras em Ciência de Dados”, Paulo de Paiva Rosa Amaral, professor de Bioengenharia no Insper, citou outras aplicações potenciais em saúde, como as tecnologias de sequenciamento do DNA humano e a medicina preventiva. “Esses dados de DNA poderiam ser usados nos sistemas de saúde”, afirmou Amaral. Ele disse que as tecnologias ficaram muito baratas. Antes, sequenciar uma única amostra de DNA custava 3 bilhões de dólares. Agora, custa 100 dólares. Grandes redes de hospitais do Brasil trabalham com o sequenciamento.
Para Amaral, a contribuição da ciência de dados é desenvolver ferramentas que facilitem a leitura da informação da pesquisa em genoma para os médicos, que não necessariamente sabem interpretar uma sequência de DNA. A abordagem low code, em que o usuário monta aplicativos sem conhecimento aprofundado de programação, já é uma realidade nessa direção.
Outras possibilidades de demanda de cientistas de dados são data mining, machine learning e inteligência artificial. Paloma Vaissman Uribe, professora de análise financeira do Insper, observou que há várias técnicas de data science que são usadas em varejo, marketing e mercado financeiro. Tanto quanto os hard skills, o diferencial do cientista de dados é saber apresentar didaticamente os projetos que está construindo. “Comunicar-se de forma errada pode destruir todo o seu modelo e gerar desconforto de seu interlocutor”, disse Paloma. “Muitas vezes, o resultado não ficou ruim ou errado, mas foi comunicado de maneira errada.”
Coordenador do Programa Avançado em Transformação Digital do Insper, o professor Carlos Valente lembrou que existe uma grande confusão em ser engenheiro e trabalhar com ciência de dados, como se uma excluísse a outra. “A ciência de dados, hoje, é uma linguagem da engenharia; o Python é como se fosse o inglês há anos”, afirmou. “Saber encontrar e tratar a informação de forma cada vez mais fácil de ser entendida é uma linguagem universal, aplicada em indústria, varejo, serviços financeiros. Nossos cursos de engenharia tem isso, tanto nas matérias mais básicas como nas eletivas nas áreas de especialização.”
Marina Bicudo de Almeida Muradian, professora de Comunicação de Dados do Insper, citou grupos de alunos que estão desenvolvendo soluções para professores acompanharem melhor o desempenho dos alunos. Outros trabalhos incluem um sistema de recomendação para varejo online e uma consultoria em economia — nesta última, desenvolve-se uma coleta e tratamento de dados macroeconômicos para analistas. “O importante é tornar essas ferramentas úteis para alguém”, disse.
Um dado apresentado por Rina Xavier Pereira, coordenadora de Educação Executiva do Insper, evidenciou alguns dos desafios vencidos pela ciência de dados, principalmente nas áreas de open banking e open finance. Em 2019, 22% da população brasileira usava algum tipo de produto ou serviço bancário. Durante a pandemia, já com boa parte dos serviços financeiros digitalizados, a proporção subiu para 60%. “Vejam como o open banking permitiu aos brasileiros conseguir se bancarizar”, comentou.
Para o matemático Eduardo Prado, sócio do C6 Bank, dados são o novo petróleo. Até o começo dos anos 2000, as opções para o cientista de dados se limitavam à docência ou à pesquisa, afirmou. Outras oportunidades surgiram à medida que o setor financeiro avançou na digitalização e na abertura dos dados — que culminou com 7,5 milhões de brasileiros consentindo o compartilhamento de seus históricos bancários entre instituições financeiras.
“O Pix, por exemplo, é fabuloso”, afirmou. “É uma agenda de modernização de uma década do Banco Central. O C6 não existiria se não estivesse num ambiente mais desconcentrado, que o Banco Central trabalhou para criar. O Brasil não foi o primeiro a implantar open finance e open banking. Tivemos a oportunidade de observar e aprender com os erros dos primeiros. E isso foi muito bem feito.”
Segundo Daniel Dantas, gerente de analytics do MercadoPago Brasil, com o compartilhamento dos dados, o setor financeiro conseguiu usar a tecnologia em benefício do cliente, não só para ter conta bancária, mas para acessar seguradoras e instituições de crédito e financiamento. Toda essa movimentação amplia a demanda por programadores e engenheiros e cientistas da computação.
Outros campos abertos para o cientista de dados estão na governança e gestão de dados científicos, como apresentaram o engenheiro Mike Frame e a biblioteconomista Vivian Hutchison, respectivamente, coordenador e chefe no Programa de Síntese, Análise e Pesquisa Científica na USGS (sigla em inglês do Serviço Geológico dos Estados Unidos).