Esse é um resumo do que você irá encontrar no curso de dados da BD.
Módulo 1 - Fundamentos de dados
O objetivo deste módulo é apresentar conceitos básicos que permeiam uma análise de dados empírica, em especial com grande volume de informações. Também apresentamos um passo a passo para a organização de uma análise de dados e aspectos relevantes da legislação sobre o assunto no país.
Aula 1: O que são dados
Aula 2: Tipos de dados (estruturados e não estruturados)
Aula 3: Tipos de variáveis
Aula 4: Como organizar uma análise de dados
Aula 5: Aspectos da legislação sobre dados no Brasil: Lai e Lgpd
Módulo 2 - Análise de dados com o Google Sheets
O objetivo deste módulo é apresentar algumas das funcionalidades do Google Sheets para análise de dados, em especial a tabela dinâmica, cuja lógica se aproxima daquela utilizada no GROUP BY em SQL, que veremos adiante. Também abordamos algumas funções básicas do Google Sheets para cálculos simples. O módulo conta com exercícios práticos no Google Sheets.
Aula 1: Análise com Tabela dinâmica;
Aula 2: Análise e estatísticas simples com o Google Sheets
Módulo 3 - Fundamentos de SQL
O objetivo deste módulo é apresentar conceitos básicos sobre banco de dados e SQL. Passamos pelas características chave dos bancos de dados relacionais, sobre o que é o SQL, como ele surgiu e quais são as suas aplicações. Exploramos a estrutura básica de uma query (consulta) e os ambientes de uso e interfaces gráficas disponíveis da linguagem.
Aula 1: O que é um bancos de dados
Aula 2: O que é o SQL
Módulo 4 - SQL no ambiente do BigQuery e a Base dos Dados
O objetivo deste módulo é apresentar o BigQuery, ambiente com o qual faremos as consultas em SQL ao longo do curso. Para isso, teremos o exercício prático de configurar o ambiente de trabalho na plataforma. Também apresentamos o datalake público da Base dos Dados – hospedada no Google Cloud – como pesquisar as tabelas tratadas no site e como se conectar ao datalake da BD através do BigQuery. Por fim, apresentamos brevemente formas alternativas de consulta aos dados (por meio do R, Python e Stata) e outras fontes de dados disponíveis no BigQuery, como as bases de dados públicas da Google.
Aula 1: Apresentação do BigQuery e configuração do ambiente de trabalho
Aula 2: Apresentação do datalake público da BD
Aula 3: Alternativas para aprofundar suas análises
Módulo 5 - Consultas no SQL para responder perguntas I
O objetivo do módulo 5 é apresentar alguns dos principais comandos em SQL para análise de dados, especialmente sobre como selecionar e filtrar dados, funções de agregação e de janela, operações com datas e o uso de condicionais para criar novas variáveis. Teremos exercícios práticos no BigQuery.
Aula 1: Selecionar e filtrar dados (SELECT FROM, DISTINCT, WHERE, AND, OR, IN, NOT, NULL, BETWEEN, operadores lógicos de comparação, LIKE);
Aula 2: Funções de agregação e janela (SUM, GROUP BY, COUNT, MIN e MAX, AVG, STDDEV, ROUND, operações aritméticas, mediana, HAVING);
Aula 3: Operações com datas (formatos de data, EXTRACT, FORMAT_DATE, DATE_DIFF, operadores de comparação, criar campo de data)
Aula 4: Condicionais como novas variáveis (CASE WHEN, apresentação dos formatos de tabela: wide e long)
Módulo 6 - Consultas no SQL para responder perguntas II
O objetivo deste módulo é avançar e aprofundar em alguns dos comandos em SQL para análise de dados. Na aula sobre relacionamentos entre tabelas exploramos o potencial do datalake público da BD, como incorporar duas ou mais tabelas em uma consulta e poupar tempo e esforço de trabalho. Nessa mesma aula mostramos como utilizar subconsultas para organizar melhor o fluxo de trabalho no editor de SQL. Também cobrimos algumas das boas práticas para otimizar as consultas e as formas de exportar as tabelas com os resultados da consulta executada.
Aula1: Relacionamentos entre tabelas (tipos de JOIN e como eles funcionam) e uso de subconsultas
Aula 2: Ordem de execução das queries no BigQuery e como otimizar as consultas
Aula3: Formas de exportar consultas
Módulo 7 - Visualização de dados
O objetivo deste módulo é apresentar alguns princípios básicos da visualização de dados e partir para a parte prática em duas ferramentas: o Google Sheets e o Looker Studio.
Aula 1: Princípios de visualização de dados
Aula 2: Visualização de dados com o Google Sheets
Aula3: Visualização de dados com o Looker Studio
Projeto final
O projeto final é requisito para emissão de certificado do curso.