Realizar busca

Como (não) mentir com dados

Professores, estudantes e alumni do Programa Avançado de Data Science e Decisão falam sobre boas práticas em análise e apresentação de dados

Professores, estudantes e alumni do Programa Avançado de Data Science e Decisão falam sobre boas práticas em análise e apresentação de dados

Alguns dos erros mais comuns cometidos em análises e apresentações de dados no dia a dia dos profissionais de Data Science, além da exposição de boas práticas e exemplos a ser considerados na tomada de decisão dos negócios. Esses assuntos estiveram entre os que foram tratados no webinar Como (não) mentir com dados, realizado pelo Insper no dia 5 de julho. O evento remoto contou com a participação de alumni e estudantes do Programa Avançado em Data Science e Decisão e foi mediado pelos professores do Insper Luiz Durão e Marina Muradian.

Confira aqui algumas das dicas compartilhadas pelos alumni, alunos e professores para evitar equívocos com os dados:

Sem dados de qualidade não há análises confiáveis

Para realizar análises confiáveis, embasadas em evidências, o uso de dados adequados é fundamental. A fim de garantir isso, o profissional de Data Science precisa estar atento à fonte, à qualidade das informações e à amostra de dados.

A capacidade de discernimento e o senso crítico para avaliar os dados antes de aplicar qualquer modelo estatístico são competências esperadas de um bom cientista de dados. “Tenho observado que a origem de boa parte dos problemas de análises e conclusões equivocadas acontece por uso de dados inadequados”, diz a alumna Jéssica Caieiro, da primeira turma do Programa Avançado de Data Science e Decisão do Insper. De acordo com ela, na seleção dos dados, é essencial entender a coleta, o tamanho e a qualidade da amostra, para conferir se de fato está representada a população de interesse. Quanto mais enviesados os dados, mais os resultados irão gerar a falsa sensação de confiança.

Atenção com a formatação e a apresentação

Além do uso de dados adequados, a forma de apresentação dos resultados deve ser um ponto de atenção entre os profissionais da área.

“A falha pode ou não ser intencional, mas é muito comum ver gráficos com erros de proporção, em especial os 3Ds. Na tentativa de trazer beleza à apresentação, os gráficos perdem a formatação e podem induzir o leitor ao erro de interpretação, mostrando grandes distâncias entre números que, na verdade, são bem próximos”, afirma o alumnus Renato Camargo, da segunda turma do Programa Avançado de Data Science e Decisão do Insper.

“Para apresentar os dados da forma mais transparente possível e não correr riscos com erros, sugiro sempre deixar os eixos nos gráficos. Por mais que você tenha o rótulo nas informações, o eixo vai ser um elemento importante para manter a proporção do gráfico e trazer essa facilidade de leitura”, diz Henrique Kozaki, alumnus da Graduação em Administração Insper e, também, do Programa Avançado de Data Science e Decisão.

Cuidado com os vieses

Dentro da estatística, o viés de seleção acontece quando o analista traz perguntas tendenciosas que podem direcionar o resultado, trazendo análises distorcidas.

Com o acesso crescente a uma infinidade de dados, o cientista da área deve questionar as informações e construir uma linha de raciocínio para chegar a resultados que realmente façam sentido. “Em uma pesquisa, por exemplo, as perguntas devem evitar tendências à escolha” diz o professor Luiz Durão. “Se você perguntar se as pessoas preferem chocolate ou olho de cabra, certamente teremos um resultado próximo a 90% favorável ao chocolate, mas esse resultado não necessariamente representa a realidade da amostra, e por isso a análise é considerada enviesada.”

Para encerrar o bate-papo, a professora Marina Muradian reforçou os diferentes papéis que os profissionais de Data Science devem considerar nas análises de seu dia a dia nas empresas.

“Antes de iniciar uma análise, é preciso ter dados confiáveis, avaliar se seus dados têm algum tipo de viés e, por fim, verificar a melhor forma de transmitir as informações a quem, de fato, irá tomar a decisão. Tudo isso, tendo conhecimento sobre o negócio”, afirma Marina. “Por isso, eu gosto tanto das trilhas do Programa Avançado em Data Science e Decisão. Trabalhamos os diferentes papéis do profissional, ao longo do curso, preparando os alunos para os desafios do mercado.”

Conheça o Programa Avançado em Data Science e Decisão. As inscrições vão até 21 de julho.

O Insper oferece um programa criado para formar cientistas de dados, profissionais que auxiliam empresas e organizações na identificação de problemas e oportunidades, bem como na tomada de decisões. O curso ensina como utilizar a modelagem estatística e aproveitar os dados, por meio de sistemas de processamento.

Assista ao webinar na íntegra:

Este website usa Cookies

Saiba como o Insper trata os seus dados pessoais em nosso Aviso de Privacidade, disponível no Portal da Privacidade.

Aviso de Privacidade

Definições Cookies

Uso de Cookies

Saiba como o Insper trata os seus dados pessoais em nosso Aviso de Privacidade, disponível no Portal da Privacidade.

Aviso de Privacidade