Home/Educação Executiva/Cursos de Curta e Média Duração/Cursos de Estratégia e Negócios/Data Science: Técnicas de Preparação e transformação de dados

Data Science: Técnicas de Preparação e transformação de dados

Curso de Curta Duração

As organizações modernas buscam a adoção de processos voltados à tomada de decisão suportados por dados. Equipes analíticas, por sua vez, buscam coletar e processar conjuntos de dados, obter insights e construir modelos, sejam eles descritivos ou preditivos, tendo como foco atender aos anseios da organização. Porém dados reais são desafiadores, e a qualidade das conclusões é dependente dos processos de transformação aplicados aos dados. Sendo, portanto, essencial entender as possibilidades e os limites da leitura e transformação dos dados, de modo a garantir a tradução precisa das informações.

No curso Data Science: Técnicas de Preparação e Transformação de Dados o participante compreenderá as melhores formas de extrair insights dos dados por meio de técnicas de leitura e transformação de variáveis, sob os mais variados contextos como: saúde, economia, marketing, social network, logística, etc. Também conhecida como engenharia de features, tais técnicas permitem a tradução mais precisa das informações disponíveis, lidando com codificação, interação entre features, padronização, missing data, redução de viés, dentre outros. Todas as aulas trarão discussões conceituais, e serão desenvolvidos cases práticos de análise e transformação de conjuntos de dados, utilizando diferentes ferramentas para tal, como Excel, Python e R.

    • Dominar a leitura do comportamento de uma variável, e formas de otimizar a extração de insight
    • Entender o conceito de features categóricas, e aplicar tipos de codificações
    • Entender o conceito de features numéricas, e aplicar normalizações e transformações
    • Compreender a ideia de interação entre variáveis, sua importância, e como identifica-las
    • Compreender os sistemas geradores de dados faltantes, e boas práticas de tratamento

Profissionais de diversas áreas e setores, que tenham interesse em aprofundar o conhecimento de análise de dados, particularmente em técnicas de leitura, preparação e transformação. Tendo como objetivo a otimização da tomada de decisão e geração de insights.

É desejável que os alunos tenham conhecimentos básicos de estatística e/ou experiência em análise de dados.

Pré-requisitos

Ter formação superior

Forma de pagamento** Valor para matrícula antecipada – EB* Valor com desconto para Alumni Valor integral do curso
À vista (boleto ou cartão) R$ 2.811,38 R$ 2.342,81 R$ 3.123,75
Em até 10 parcelas (cartão de crédito) R$ 281,13 R$ 234,28 R$ 312,37

*EB (10% de desconto) para matrículas realizadas até 15 dias antes do início das aulas, aplicado sobre o valor integral do curso.

**Verifique a quantidade de parcelas disponíveis para pagamento com cartão de crédito. Concedido 5% de desconto para pagamento à vista (desconto não cumulativo com EB e Alumni).

O processo seletivo do Insper é simples e objetivo. Conheça as etapas para ingressar no curso:

Após realizar sua inscrição no curso, entraremos em contato através de telefone, e-mail ou por Whatsapp para você continuar o processo e realizar sua matrícula.

Confira as políticas de descontos dos curso de Curta Duração

Matrículas Antecipadas (Early Bird): 10% de desconto sobre o valor total do curso, concedido para matrículas realizadas até 15 dias antes do início das aulas. Além do desconto no pagamento, a antecipação da matrícula permite a disponibilização de materiais, leitura prévia ou aplicação de testes (conforme a necessidade de cada curso), uma melhor organização da aula por parte do professor e da escola, para recepcionar os novos alunos com excelência.

CONTEÚDO PROGRAMÁTICO

O workflow de Análise de Dados

Mais
  • Pipeline da ciência de dados
  • Tradução do conceito de Feature Engineer e suas aplicações

Análise Descritiva Avançada

Mais
  • Armadilhas de medidas descritivas
  • Distribuição amostral
  • Definindo o comportamento das features segundo: forma, posição, dispersão e outliers

Features Categóricas

Mais
  • Visualização (Dataviz) para dados categóricos.
  • Codificações: fator, dummy e hot coding. Interpretações.
  • Variáveis nominais vs. ordinais.
  • Dados desbalanceados

Features Numéricas

Mais
  • Visualização (Dataviz) para dados numéricos. Normalizações.
  • Transformações 1:1, 1:many e many:many. Interpretações.

Identificação de efeitos de interações

Mais
  • Efeitos das interações.
  • Guia de princípios para identificação de interações.
  • Considerações e exemplos práticos.

Lidando com dados parciais ou faltantes

Mais
  • Entendimento do processo gerador do missing
  • Redução de viés
  • Codificação/imputação de dados faltantes
  • Casos especiais

Projeto aplicado

Mais

Os alunos serão alocados em duplas e irão escolher um conjunto de dados real de um tema de interesse, sob o qual deverão realizar as transformações das features de modo a superar os desafios apresentados pelos dados reais, e trazer os insights obtidos.

Corpo docente


Sujeito a alterações de acordo com a disponibilidade dos professores

Para mais informações acesse o protocolo de retorno.

A definir

Investimento: A partir de R$ 2.811,38**
(em até 10x no cartão de crédito)
** Valor para matrícula antecipada
Consulte outras condições na aba Investimento

*Carga horária

17,5 horas de aulas síncronas: ao vivo com o docente e demais participantes

Atividades assíncronas: É estimada dedicação de 08 horas para o projeto aplicado e atividades assíncronas (por exemplo, leituras, vídeos e estudos de casos).