Home/Pós-Graduação/Programas Avançados/Programa Avançado em Data Science e Decisão

Programa Avançado em Data Science e Decisão

Muitos dados são gerados diariamente e quase todos eles podem ser analisados e mensurados. Desde o horário em que a pessoa sai de casa em direção ao trabalho, o número de passos que deu até uma loja, o que consumiu e em quanto tempo. No entanto, é necessária uma análise adequada para que esses dados deixem de ser um aglomerado de números e se transformem em informação que faça a diferença no planejamento das empresas. As organizações podem usar informações deste tipo para obter vantagens competitivas. Por exemplo, com base na localização, preferências do consumidor, rotina e outros dados disponíveis, as companhias podem estimar tendências e fazer previsões mais assertivas para o rumo dos negócios.

Nesse cenário, surge a necessidade de um novo profissional nas empresas: o cientista de dados. Esses profissionais devem ter habilidade de coletar, estruturar e analisar dados para obter informações para o negócio, identificando, por exemplo, padrões de comportamento.

Além das competências técnicas, o cientista de dados deve saber interpretar e comunicar os resultados e orientar os líderes na tomada de decisões importantes para o negócio. O profissional precisa ser ativo, com autonomia até mesmo para propor soluções. Não há mais espaço no mercado para quem faz apenas o que é solicitado.” Destaca o pesquisador e professor Hedibert Freitas Lopes.

O Programa Avançado em Data Science e Decisão do Insper foi criado para formar cientistas de dados, profissionais que auxiliam empresas e organizações na identificação de problemas e oportunidades (internos e externos), propondo a seguir soluções para problemas ou oportunidades organizacionais, auxiliando na tomada de decisões. O propósito é formar cientistas de dados que apoiem as decisões de executivos por meio de modelagem estatística para explicar o problema ou oportunidade em foco, utilizando os dados que extrairá, organizará e combinará por meio de sistemas de processamento. Durante este processo, o cientista de dados utiliza métodos de design (aplicados à ciência dos dados) na interação com os stakeholders relacionados com o problema ou a oportunidade.

Características específicas | Ensino Híbrido

O formato híbrido da Pós-graduação em Data Science e Decisão propõe o melhor de dois mundos. A parte remota do curso, 2/3 da duração, oferece a praticidade de acompanhar as aulas de qualquer lugar, sem o investimento em deslocamento. A parte presencial do curso, 1/3 da duração, traz a possibilidade de interação e troca entre os alunos, criando oportunidades de networking e aprendizado únicas.

Ao longo do curso, os alunos contam com uma infraestrutura em nuvem disponibilizada pela escola, para desenvolver suas atividades no ambiente computacional adequado.

O projeto final é desenvolvido em parceria com empresas, levando o cotidiano da sala de aula para um “teste em produção”, em que os alunos experimentam o contexto profissional do uso de dados. 

A dinâmica das aulas remotas acontece em uma plataforma que permite a interação ao vivo, em tempo real, entre professores e alunos, seja num contexto mais expositivo, ou para trabalho em equipe. Diversos recursos tecnológicos (mentimeter, kahoot, socrative, miro, google colab, etc) são usados nas aulas para criar uma experiência atual e interessante.

Conteúdos gravados pelos professores também serão oferecidos para enriquecer os materiais de consulta sugeridos. E os alunos também terão monitorias com professores auxiliares à disposição para resolver dúvidas sobre exercícios e projetos. 

Por que fazer o Programa Avançado em Data Science e Decisão no Insper?

Dois professores em sala de aula

Para apoiar o processo de aprendizagem, o conteúdo é ministrado por um professor que é acompanhado de um docente assistente.

Imersão para resolução de problemas reais das organizações

O programa é focado em atividades práticas para empregar conceitos e técnicas da ciência de dados. Para reforçar esse método, no último módulo do curso os alunos escolhem uma empresa com um problema real para propor soluções inovadoras.

Melhores práticas

O uso de linguagens R e Python são úteis para um grande leque de aplicações, como análise exploratória inicial de dados, uso de modelos estatísticos complexos, visualização de resultados, manuseio de grande volume de dados e implantação de algoritmos em produção.

Design centrado no usuário

O curso desenvolve, simultaneamente, competências de design aplicadas à ciência dos dados, facilitando a interação com o negócio na identificação de problemas e permitindo a criação de soluções a serem compartilhadas com os executivos para as tomadas de decisão.

Ensino e pesquisa

Nosso corpo docente alia conhecimento avançado e pesquisas na área ao domínio na tecnologia de aplicação.

Projeto aplicado

O projeto de conclusão do curso é feito no último semestre do programa com uma das empresas parceiras do Insper.

Objetivos do programa

Ao final do curso, os alunos da Pós-graduação em Data Science e Decisão estarão aptos a:

  • Apoiar a tomada de decisão, com auxílio de modelos estatísticos que expliquem um problema ou uma oportunidade de negócio e as incertezas associadas;
  • Extrair, organizar e combinar dados, estruturados ou não, numéricos ou textuais, para a modelagem estatística do problema ou da oportunidade de negócio;
  • Desenvolver sistemas de processamento de dados (incluindo larga escala) que viabilizem a análise de modelo estatístico aplicado aos dados referentes ao assunto em questão;
  • Utilizar técnicas de design na formulação de problemas ou oportunidades de negócio e criação de possíveis soluções, interagindo de forma assertiva com os stakeholders.

A quem se destina

O curso é pensado para pessoas com  vivência de negócio e familiaridade com métodos estatísticos, computacionais, em especial quem tem formação com base quantitativa (Estatística, Ciências da Computação, Engenharia, Física, Economia). É recomendado tanto para quem já atua como cientista de dados e quer sofisticar seus conhecimentos, quanto para pessoas que pretendem entrar na área.

Experiência extra curso

Os alunos participarão de oficinas, workshops e clínicas temáticas para se aprofundar em temas específicos. Assim, conhecerão novidades e cases de Data Science, se mantendo super atualizados como todo cientista de dados deve ser.

O curso é desenvolvido ao longo de 18 meses, entre aulas online e presenciais, sendo que os últimos seis meses trazem oficinas, workshops e o Projeto Capstone, desenvolvido em empresas parceiras para solucionar problemas reais.

As disciplinas do curso são agrupadas em trilhas com atividades integradoras, experiências do mundo real que conectam os conhecimentos explorados. As trilhas são: Design, Modelagem, Dados e Processamento.

1° trimestre

Mais
  • Aprendizagem Estatística de Máquina I

A disciplina visa desenvolver a capacidade de aplicar diversos métodos de inferência estatística e aprendizagem de máquina a problemas relacionados a Negócios e Ciências Sociais, com ênfase na predição, selecionando melhores métodos considerando suas características, e implantando-os computacionalmente. Entre os métodos explorados: classificação e regressão por vizinhos mais próximos, modelos de regressão penalizados, árvores, bagging, florestas aleatórias, boosting e técnicas de conglomerados.

  • Computação para Ciência de Dados

A disciplina inclui revisão de lógica de programação em Python, além de análise de dados estruturados e não estruturados, elaborando manipulação, transformação, e limpeza utilizando computação avançada focada em uso intensivo de dados, computação numérica, geração de gráficos para análise, uso de APIs na Internet, análise e processamento de dados com dataframe e visualização e combinação de dados.

2° trimestre

Mais
  • Aprendizagem Estatística de Máquina II

Revisão dos Fundamentos de Modelagem Preditiva; Principais Métricas Preditivas; Máquinas de Vetores de Suporte; Redes Neurais; Aprendizagem Não Supervisionada; Análise de Conglomerados; Análise de Componentes Principais; Escalonamento Multidimensional; Dados Textuais; Modelo de Tópicos.

  • Big Data e Computação em Nuvem

Criar soluções para análise de dados em grande escala na nuvem utilizando sistemas de arquivos, bancos de dados estruturados e Apache Spark. O aluno aprenderá a desenhar arquiteturas para análise de dados em grande escala baseadas em serviços na nuvem;
planejar, estruturar e utilizar bancos de dados estruturados SQL em nuvem; e desenvolver algoritmos para a análise de dados em grande escala utilizando Python, Spark e arquiteturas em nuvem.

3° trimestre

Mais
  • Prática Avançada de Data Science e Visualization

Disciplina que combina e aprofunda aspectos de modelagem, processamento e dados em diferentes situações de negócios, além de desenvolver competências de design de informações para apresentações em diversos formatos, conforme objetivo e audiência.

  • Métodos de Design para Ciência de Dados

A disciplina trabalha design de informação: princípios (cognição, comunicação e estética); design, legendas e diagramas; design de gráficos e tabelas e métricas; metodologias ágeis e prototipação: papéis, sprints, planejamento de iterações, testes de aceitação.

  • Data Science Deploy

A disciplina trabalha o processo e as técnicas para deploy e entrega contínua de soluções de ciência de dados, abordando tópicos como: máquinas virtuais e containers, deploy de aplicações em infraestrutura local e nuvem, deploy de dashboards, gestão de projetos e colaboração com Git & Github, Continuous Delivery e Continuous Integration.

4° trimestre

Mais
  • Financial analytics 

Aborda Finanças analíticas, Métodos de séries temporais, Vetores autoregressivos e previsões de curto e longo prazo. 

  • Marketing analytics 

Inclui Medição e dimensionamento, análise fatorial, mapa perceptual, Técnicas de segmentação, Aprendizagem não supervisionada e Análise discriminante..

5° trimestre

Mais
  • Projeto de encerramento (Capstone) – Análises Iniciais

Os alunos participam da resolução de um problema real na área de ciência dos dados do setor privado ou público, por meio da combinação de fontes de dados e ferramentas de análise em suporte à tomada de decisão.

  • Clínicas

Oficinas e workshops temáticos sobre ferramentas e aplicações em setores ou tipos de problemas específicos, com profissionais e acadêmicos do Insper e do mercado.

6° trimestre

Mais
  • Projeto de encerramento (Capstone) – Apresentação / Titulação

Os alunos realizam um projeto de ciência dos dados patrocinado por docente interno ou terceiro. Este projeto combina um desafio na formulação de problemas a desafios técnicos nas áreas de estatística e computação para a solução de um problema de negócio real.

  • Clínicas (Design)

Oficinas e workshops temáticos sobre ferramentas e aplicações em setores ou tipos de problemas específicos, com profissionais e acadêmicos do Insper e do mercado.

Forma de pagamento* Desconto 1
Válido até: 20/12/2022
Desconto 2
Válido até: 16/01/2023
Valor integral
À vista R$ 58.408,00 R$ 59.943,58 R$ 61.479,16
18 parcelas R$ 3.497,72
R$ 62.958,91
R$ 3.589,62
R$ 64.613,15
R$ 3.681,91
R$ 66.274,37
24 parcelas R$ 2.692,51
R$ 64.620,13
R$ 2.763,47
R$ 66.323,23
R$ 2.834,14
R$ 68.019,35
30 parcelas R$ 2.210,31
R$ 66.309,27
R$ 2.268,47
R$ 68.054,25
R$ 2.326,64
R$ 69.799,23

Veja mais informações sobre as condições de pagamento do curso.

Os valores apresentados acima se referem a turmas com início das aulas em 2023.

David Kallás – Sócio da KC&D, professor no Instituto Israelita de Ensino e Pesquisa Albert Einstein e no Insper, onde acumula a Coordenação Executiva da Pós-graduação Lato Sensu. É Vice-Presidente da Anefac – Associação Nacional de Executivos de Finanças, Administração e Contabilidade. É doutor em estratégia pela pela FGV/EAESP, mestre e graduado em administração pela FEA/USP. Possui artigos publicados em diversos periódicos nacionais e internacionais, e autor em 5 livros sobre gestão e estratégia.

&nbsp

André Filipe de Moraes Batista – PhD em Engenharia de Computação pela Universidade de São Paulo (USP). Graduação e mestrado em ciência da computação com ênfase em inteligência artificial. Mais de 10 anos de experiência no mercado de tecnologia da informação e computação de alto desempenho.  Atua também como cientista de dados na área da Saúde; realizou pós-doutorado em Data Science aplicado à Saúde na Escola de Saúde Pública da Universidade de São Paulo, com parcerias internacionais, em destaque com a Universidade de Harvard.


Sujeito a alterações de acordo com a disponibilidade dos professores.

Sex

10

Fev

Híbrido

Carga horária: 424 horas

Aula Magna: 30 de janeiro de 2023

Início das aulas: 10 de fevereiro de 2023

Aulas online: Segundas e quartas das 19h às 22h30. Aulas presenciais*: Sextas das 18h às 22h e sábados das 8h às 17h

Encerramento das matrículas*: 27 de janeiro de 2023

*Aulas presenciais são encontros pontuais, marcados no calendário do trimestre. Para matricular-se é necessário passar por todas as etapas do processo seletivo.
Os cursos de pós-graduação Insper podem ter reposições de aula por conta de feriados, pontes ou problemas com docentes e elas são feitas excepcionalmente às sextas-feiras.