Home/Pós-Graduação/Programas Avançados/Programa Avançado em Data Science e Decisão

Programa Avançado em Data Science e Decisão

Programa avançado para Cientista de Dados

Muitos dados são gerados diariamente e quase todos eles podem ser analisados e mensurados. Desde o horário em que a pessoa sai de casa em direção ao trabalho, o número de passos que deu até uma loja, o que consumiu e em quanto tempo. No entanto, é necessária uma análise adequada para que esses dados deixem de ser um aglomerado de números e se transformem em informação que faça a diferença no planejamento das empresas. As organizações podem usar informações deste tipo para obter vantagens competitivas. Por exemplo, com base na localização, preferências do consumidor, rotina e outros dados disponíveis, as companhias podem estimar tendências e fazer previsões mais assertivas para o rumo dos negócios.

Nesse cenário, surge a necessidade de um novo profissional nas empresas: o cientista de dados. Esses profissionais devem ter habilidade de coletar, estruturar e analisar dados para obter informações para o negócio, identificando, por exemplo, padrões de comportamento. “Além das competências técnicas, este novo profissional deve saber interpretar e comunicar os resultados e orientar os líderes na tomada de decisões importantes para o negócio”, destaca o pesquisador e professor Hedibert Freitas Lopes. “O cientista de dados precisa ser ativo, com autonomia até mesmo para propor soluções. Não há mais espaço no mercado para quem faz apenas o que é solicitado.”

O Programa Avançado em Data Science e Decisão do Insper foi criado para formar cientistas de dados, profissionais que auxiliam empresas e organizações na identificação de problemas e oportunidades (internos e externos), propondo a seguir soluções para problemas ou oportunidades organizacionais, auxiliando na tomada de decisões. O propósito é formar cientistas de dados que apoiem as decisões de executivos por meio de modelagem estatística para explicar o problema ou oportunidade em foco, utilizando os dados que extrairá, organizará e combinará por meio de sistemas de processamento. Durante este processo, o cientista de dados utiliza métodos de design (aplicados à ciência dos dados) na interação com os stakeholders relacionados com o problema ou a oportunidade.

Objetivos do programa

Ao final do curso, os alunos do Programa Avançado em Data Science e Decisão estarão aptos a:

  • Dar suporte à tomada de decisão, com auxílio de modelos estatísticos selecionados que expliquem um problema ou uma oportunidade de negócio e as incertezas associadas;
  • Extrair, organizar e combinar dados, estruturados ou não, numéricos ou textuais, para a modelagem estatística do problema ou da oportunidade de negócio;
  • Desenvolver sistemas de processamento de dados (incluindo larga escala) que viabilizem a análise de modelo estatístico aplicado aos dados referentes ao assunto em questão;
  • Utilizar técnicas de design na formulação de problemas ou oportunidades de negócio e criação de possíveis soluções, interagindo de forma assertiva junto aos stakeholders.

 

A quem se destina

O programa do Insper é indicado a profissionais com alguma vivência de negócio e familiaridade com métodos estatísticos e/ou computacionais, em especial os que possuem formação com base quantitativa: Estatística, Ciências da Computação, Engenharia, Física, Economia, Administração e áreas correlatas. É recomendado tanto aos que já atuam como cientista de dados e desejam se aprofundar nos métodos quanto aos que estão migrando para essa área.

Pré-requisitos

Podem se candidatar ao programa profissionais que tenham preferencialmente entre três e dez anos de experiência nas áreas sugeridas.

Por que fazer Programa Avançado em Data Science e Decisão no Insper?

  • A pós-graduação é baseada em atividades de aplicação distribuídas ao longo do programa para que o aluno empregue conceitos e técnicas de ciência dos dados a problemas reais do mercado. O final do curso é reservado para uma atividade de aplicação que resolve um problema real e de porte de uma organização (que pode ser, inclusive, aquela em que o aluno trabalha).
  • O programa inclui o uso de linguagens R e Python, que estão entre as mais utilizadas pelos cientistas de dados por serem úteis para um grande leque de aplicações, como análise exploratória inicial de dados, uso de modelos estatísticos mais complexos, visualização de resultados, manuseio de grande volume de dados e implantação de algoritmos em produção. Além disso, são distribuídas gratuitamente e empregam código fonte aberto.
  • O curso desenvolve, simultaneamente, competências de design aplicadas à ciência dos dados, facilitando a interação com o negócio na identificação de problemas e permitindo a criação de soluções a serem compartilhadas com os executivos para as tomadas de decisão.
  • Nosso corpo docente alia conhecimento avançado de pesquisas na área ao domínio na tecnologia de aplicação.

Experiência extra curso

Os alunos participarão de oficinas, workshops e clínicas temáticas para se aprofundar em temas específicos. Assim, conhecerão novidades e cases na área de Data Science, garantindo a reciclagem contínua e a visão de aplicação que a área demanda de seus profissionais.

O Programa Avançado em Data Science e Decisão possui carga horária total de 424 horas. Destas, 260 serão de aulas, 120 horas de experiências práticas, realizadas em laboratório, e 44 horas dedicadas a oficinas e workshops. O tempo de conclusão é de 18 meses, sendo que os últimos dois trimestres são dedicados ao Trabalho de Conclusão de Curso (projeto capstone) e a oficinas e workshops.

Suas disciplinas são divididas em trilhas, que agrupam atividades integradoras: Trilha de Design (duas disciplinas e clínicas), Trilha de Modelagem (três disciplinas), Trilha de Dados e Trilha de Processamento (três disciplinas).

O segundo e o quarto trimestre contam, ainda, com Projetos Integradores, que permitem ao aluno aplicar em conjunto os fundamentos aprendidos de modelagem, utilizando dados estruturados e não-estruturados e técnicas de design em diferentes contextos de negócio e condições tecnológicas, de forma a propor uma solução que atenda à necessidade ou oportunidade colocada.

Já os dois últimos trimestres incluem as clínicas, oficinas e workshops temáticos sobre ferramentas e aplicações em setores ou tipos de problemas específicos, com profissionais e acadêmicos do Insper e do mercado.

1° trimestre

  • Modelos Preditivos

A disciplina aborda Fundamentos de Estatística usando R, Elementos de inferência estatística, Medição de qualidade de ajuste, Regressão linear simples e múltipla, Regressão logística, Análise discriminante, classificação, validação cruzada, métodos de Monte Carlo e bootstrap.

  • Computação para Ciência de Dados

A disciplina inclui Revisão de lógica de programação em Python, Introdução a sistemas de informação cliente-servidor, Processamento numérico e aprendizagem de máquina com Python e Sistemas de informação para processamento de dados.

  • Introdução ao Design para Ciência de Dados

Serão trabalhados: Stakeholders – mapeamento de interesses e influências e gestão de stakeholders e Elicitação de problemas.

2° trimestre

  • Modelagem Preditiva Avançada

São abordados Seleção e regularização de modelos, Redução de dimensões, Modelos aditivos generalizados, Métodos em árvore e Aprendizagem não supervisionada.

  • Big Data e Computação em Nuvem

É uma introdução ao uso de sistemas de computação em nuvem. Trata sobre Bancos de dados relacionais e não-relacionais, Sistemas de armazenamento e backup, políticas de gerenciamento de dados, ETL com Hadoop e Spark.

  • Projeto Integrador I

Atividade que permite ao aluno aplicar em conjunto os fundamentos aprendidos de modelagem, utilizando dados estruturados e não-estruturados e técnicas de design em diferentes contextos de negócio e condições tecnológicas, de forma a propor uma solução que atenda à necessidade ou oportunidade colocada.

3° trimestre

  • Prática Avançada de Data Science e Visualization

Disciplina que combina e aprofunda aspectos de modelagem, processamento e dados em diferentes situações de negócios, além de desenvolver competências de design de informações para apresentações em diversos formatos, conforme objetivo e audiência.

  • Métodos de Design para Ciência de Dados

A disciplina trabalha design de informação: princípios (cognição, comunicação e estética); design, legendas e diagramas; design de gráficos e tabelas e métricas; Metodologias ágeis e Prototipação: papéis, sprints, planejamento de iterações, testes de aceitação.

4° trimestre

  • Financial Analytics

Aborda Finanças analíticas, Métodos de séries temporais, Vetores autoregressivos e previsões de curto e longo prazo.

  • Marketing Analytics

Inclui Medição e dimensionamento, análise fatorial, mapa perceptual, Técnicas de segmentação, Aprendizagem não supervisionada e Análise discriminante.

  • Projeto Integrador II

Atividade que permite ao aluno aplicar em conjunto os fundamentos aprendidos de modelagem, utilizando dados estruturados e não-estruturados e técnicas de design em diferentes contextos de negócio e condições tecnológicas, de forma a propor uma solução que atenda à necessidade ou oportunidade colocada.

5° trimestre

  • Projeto de encerramento (Capstone) – Análises Iniciais

Os alunos participam da resolução de um problema real na área de ciência dos dados do setor privado ou público, por meio da combinação de fontes de dados e ferramentas de análise em suporte à tomada de decisão.

  • Clínicas (Design)

Oficinas e workshops temáticos sobre ferramentas e aplicações em setores ou tipos de problemas específicos, com profissionais e acadêmicos do Insper e do mercado.

6° trimestre

  • Projeto de encerramento (Capstone) – Apresentação / Titulação

Os alunos realizam um projeto de ciência dos dados patrocinado por docente interno ou terceiro. Este projeto combina um desafio na formulação de problemas a desafios técnicos nas áreas de estatística e computação para a solução de um problema de negócio real.

  • Clínicas (Design)

Oficinas e workshops temáticos sobre ferramentas e aplicações em setores ou tipos de problemas específicos, com profissionais e acadêmicos do Insper e do mercado.

Guy Cliquet do Amaral Filho – PhD em Comportamento Organizacional pela Tulane University (New Orleans) e Mestre em Engenharia Mecatrônica pela Escola Politécnica da USP. Graduou-se no ITA – Instituto Tecnológico da Aeronáutica. Além de docente, possui 25 anos de experiência profissional em empresas como Twill, American Tool Companies, Synchro e Braskem, onde atuou em posições de gerência sênior. Sua experiência em Gestão de Projetos inclui iniciativas na área de Sistemas de Gestão, Automação, Manufatura, Desenvolvimento de Software e Ensino.

Nosso corpo docente é formado por profissionais que aliam sólida formação acadêmica e vasta experiência nas diversas áreas nucleares e complementares do Data Science, tais como Estatística, Engenharia e Tecnologia da Informação; e em diferentes setores públicos e de negócios. Este mix de competências confere ao curso um olhar multidisciplinar e proporciona ao aluno um leque amplo de experiências de aprendizagem.

 

Hedibert Freitas Lopes

Graduação e mestrado em Estatística pela UFRJ (1990 e 1994) e doutorado em Estatística e Teoria da Decisão pela Duke University (2000).

Iniciou como professor em estatística na Universidade Federal Fluminense, Universidade Federal do Rio de Janeiro e Universidade Federal do Rio de Janeiro. Tornou-se Assistant Professor of Econometrics and Statistics da University of Chicago Booth School of Business (2003 – 2007) e Associate Professor of Econometrics and Statistics da University of Chicago Booth School (2007 a 2013). Atualmente é Professor de Estatística e Econometria do Insper – Instituto de Ensino e Pesquisa.

Pesquisa em várias áreas da Estatística e da Econometria, com particular ênfase em métodos computacionais (MCMC, algoritmos de saltos reversíveis e filtros de partículas) e na abordagem Bayesiana em modelos dinâmicos, modelos fatoriais, modelos espaço-temporais, teoria do valor extremo, copula dinâmica, modelos de misturas, modelos de volatilidade estocástica univariada e multivariada, econometria financeira e series temporais e variáveis instrumentais.

Desde 2000, foi convidado a palestrar em cerca de 80 encontros nacionais e internacionais. Publicou 5 livros/monografias, mais de 50 artigos/capítulos publicados ou aceitos para publicação (JASA, AOAS, Statistical Science, Statistica Sinica, Bayesian Statistics, Journal of Econometrics, Journal of Time Series Analysis, Bayesian Analysis, Biometrics, CSDA, Environmetrics, entre outros) e cerca de 30 relatórios técnicos, notas e discussões.

Editor associado do JBES e da Bayesian Analysis e revisor de várias editoras, entre elas Wiley and Sons, Springer-Verlag e Chapman & Hall/CRC, alem de cerca de 40 periódicos internacionais, entre eles JASA, JRSS-B, AOS, AOAS, JCGS, Biometrics, JABES, Journal of Econometrics, JBES e JAE.

 

Paulo Cilas Marques Filho

Bacharel em Física (1992 – Universidade de São Paulo) e Doutor em Estatística (2011 – Universidade de São Paulo).

Atua no Insper como docente tempo integral em Estatística, Machine Learning e Data Science. É pesquisador no Insper nas áreas de Inferência Bayesiana e Machine Learning. Possui cinco artigos publicados em revistas tais como “Open Journal of Genetics” e “Physical Review”.

Atuou no campo empresarial como coordenador do Comitê Técnico de Serviços de Audiência de TV do SBT e da TV Record, como consultor em desenvolvimento de sistemas e infra-estrutura de Internet do SBT e como sócio-gerente e diretor técnico da U-Net Systems do Brasil Ltda.

 

Daniel de Souza Carvalho

Possui graduação em Engenharia da Computação pela Universidade Braz Cubas (2001) e mestrado em Engenharia Elétrica pela Universidade Presbiteriana Mackenzie (2009).

Tem experiência na área de Ciência da Computação, com ênfase em linguagem formais e autômatos, atuando principalmente nos seguintes temas: objetos de aprendizagem, projeto assistido por computador, vídeo games, computação evolutiva, inteligência de enxame, redes neurais; sistemas imunológicos artificiais, vida artificial, inteligência artificial e banco de dados. Atuou em diversas empresas na área de tecnologia, tais como Advisor Tecnologia, A2F Solutions, IBM, Price WaterhouseCoopers e Wolfram Research Inc.

Possui 5 trabalhos publicados em congressos (XI International Conference on Engineering and Technology Education, Conferência Internacional de Educação em Engenharia e Tecnologia e World Congress on Communication and Arts).

 

Donald Neuman

Doutor em Administração com foco na Gestão da Cadeia de Suprimentos pela Graduate School of Excellence for Advanced Manufacturing Engineering da Universidade de Stuttgart, Alemanha (2012), mestre em Produção e Sistemas com ênfase em Controle e Automação e Inteligência Artificial pela Pontifícia Universidade Católica do Paraná (2006), Engenheiro de Computação pela Pontifícia Universidade Católica do Paraná (2003) e Administrador pela Universidade Federal do Paraná (2004).

Atualmente é sócio da CTI Global onde lidera a prática de consultoria em Ciência de Dados, I.A. e Gestão da Cadeia de Suprimentos. Além disso, assina a coluna “Gestão em Foco” na Revista Mundo Logística. Foi gerente de demanda do Boticário, onde estabeleceu a gerência, seus processos e sistemas, bem como uma coordenação de ciência de dados aplicada à previsão, utilizando técnicas de baseadas em aprendizagem de máquina.

Combina experiências de gestão, engenharia de produção e engenharia de computação, aplicando ciência de dados, inteligência artificial e pesquisa operacional em diferentes setores com foco nos seguintes domínios: automação de marketing, gestão avançada de demanda e otimização da cadeia de suprimentos. Possui um livro publicado, 9 trabalhos publicados em anais de congressos e 18 textos em jornais de notícias/revistas, além de uma série de outras produções bibliográficas.

 

Tiago Mendonça dos Santos

Doutorando, mestre e graduado em Estatística pelo Instituto de Matemática e Estatística da Universidade de São Paulo. Conduziu sua pesquisa de mestrado sobre avaliação do desempenho de modelos preditivos no contexto de análise de sobrevivência e está desenvolvendo métodos de Machine Learning em sua tese.  

Atua como professor no Insper – Instituto de Ensino e Pesquisa. Já ministrou cursos no programa de especialização em Estatística Aplicada na Universidade Cruzeiro do Sul e foi docente do Centro Universitário Capital – UniCapital. Além disso, é sócio em empresa de consultoria estatística que atua nas mais diversas áreas. Trabalha com consultorias para hospitais, laboratórios, institutos de pesquisa de mercado, empresas químicas e pesquisadores.