Sobre o Curso
Python é essencial para qualquer atividade relacionada à Análise de Dados e ao cenário de Data Science. Neste curso, você aprenderá a utilizar Python para processar, tratar e analisar dados, empregando diversas técnicas estatísticas e transformações aplicadas a dataframes. Abordaremos problemas relacionados a pipeline de vendas, perfis de consumo de produtos, frequência de associações e desassociações, entre outros cenários.
Utilizando as principais bibliotecas Python para análise de dados ? Numpy, Pandas, Matplotlib, Seaborn ? você será capaz de manipular dados para extrair insights e conclusões, resolvendo problemas organizacionais. O treinamento culmina com uma Introdução ao Machine Learning, permitindo que, após as etapas de preparação, carregamento, limpeza e análise de dados, os participantes construam seus primeiros modelos de Machine Learning.
Big Data está em ascensão no mercado atualmente e uma das linguagens de programação mais utilizadas nos projetos de Big Data é a linguagem Python. Esta é uma linguagem Open Source e que está em constante construção por sua comunidade global. Neste curso serão abordados as principais utilizações da linguagem Python em projetos e ferramentas de Big Data, o estudante receberá orientações teóricas e práticas sobre como iniciar neste novo mundo que une a programação e diversas técnicas para análise de grandes massas de dados.
Introdução ao Matplotlib
- Tipos de plotagem
Seaborn Data Visualization
- Heat Map (Visualização com mapa de calor)
- Criando um mapa de calor
- Mapa de cores sequencial (Sequential colormaps)
- Seaborn heatmap colorbar
Numpy
- NumPy Matriz (Array)
- Operações de Matrizes
- Multiplicação de duas matrizes
- Acessando elementos de uma matriz: colunas e linhas
- Fatiamento (slicing) de uma matriz np
Pandas
-
Explorando Dados com Dataframes
- Ler arquivo Excel
- Importar arquivo CSV
- Ler arquivo de texto
- Aplicar uma função a colunas/linhas
- Classificar valores/classificar por coluna
- Contagem de valores únicos
- Gerar arquivo Excel
- Gerar arquivo CSV
- Gerar arquivo HTML
-
Pivot Table em Pandas
- Acessar os dados
- “Pivotando” os dados
- Colunas e valores
- Filtros avançados
- GroupBy
Aprofundando Data Analysis
- Análise da Distribuição
- Análise de Variáveis Categóricas
- Munging de dados com Python: Usando Pandas
- Analisando grandes volumes de dados
- Lendo o arquivo
- Utilizando o Pandas
- Formatando o resultado
- Matriz de Correlação
- Qual é o coeficiente de correlação?
- Traçando a matriz de correlação
- Interpretando a matriz de correlação
- Adicionando título e rótulos ao gráfico
- Classificando a matriz de correlação
- Seleção de pares de correlação negativa
Introdução ao Machine Learning
- Como iniciar um projeto de aprendizado de máquina em Python
Desenvolvedores, Cientistas de Dados, Analistas de Big Data, curiososTer participado do treinamento Python Foundation (é fundamental o conhecimento em linguagem de programação Python)Curso prático e teórico.
Português ou Inglês.