Análise de dados com Python Aplicado a Big Data

Sobre o Curso

Python é essencial para qualquer atividade relacionada à Análise de Dados e ao cenário de Data Science. Neste curso, você aprenderá a utilizar Python para processar, tratar e analisar dados, empregando diversas técnicas estatísticas e transformações aplicadas a dataframes. Abordaremos problemas relacionados a pipeline de vendas, perfis de consumo de produtos, frequência de associações e desassociações, entre outros cenários.

Utilizando as principais bibliotecas Python para análise de dados ? Numpy, Pandas, Matplotlib, Seaborn ? você será capaz de manipular dados para extrair insights e conclusões, resolvendo problemas organizacionais. O treinamento culmina com uma Introdução ao Machine Learning, permitindo que, após as etapas de preparação, carregamento, limpeza e análise de dados, os participantes construam seus primeiros modelos de Machine Learning.

Big Data está em ascensão no mercado atualmente e uma das linguagens de programação mais utilizadas nos projetos de Big Data é a linguagem Python. Esta é uma linguagem Open Source e que está em constante construção por sua comunidade global. Neste curso serão abordados as principais utilizações da linguagem Python em projetos e ferramentas de Big Data, o estudante receberá orientações teóricas e práticas sobre como iniciar neste novo mundo que une a programação e diversas técnicas para análise de grandes massas de dados.

Introdução ao Matplotlib

  • Tipos de plotagem

Seaborn Data Visualization

  • Heat Map (Visualização com mapa de calor)
    • Criando um mapa de calor
    • Mapa de cores sequencial (Sequential colormaps)
    • Seaborn heatmap colorbar

Numpy

  • NumPy Matriz (Array)
    • Operações de Matrizes
    • Multiplicação de duas matrizes
    • Acessando elementos de uma matriz: colunas e linhas
    • Fatiamento (slicing) de uma matriz np

Pandas

  • Explorando Dados com Dataframes

    • Ler arquivo Excel
    • Importar arquivo CSV
    • Ler arquivo de texto
    • Aplicar uma função a colunas/linhas
    • Classificar valores/classificar por coluna
    • Contagem de valores únicos
    • Gerar arquivo Excel
    • Gerar arquivo CSV
    • Gerar arquivo HTML
  • Pivot Table em Pandas

    • Acessar os dados
    • “Pivotando” os dados
    • Colunas e valores
    • Filtros avançados
    • GroupBy

Aprofundando Data Analysis

  • Análise da Distribuição
  • Análise de Variáveis Categóricas
  • Munging de dados com Python: Usando Pandas
    • Analisando grandes volumes de dados
    • Lendo o arquivo
    • Utilizando o Pandas
    • Formatando o resultado
    • Matriz de Correlação
      • Qual é o coeficiente de correlação?
      • Traçando a matriz de correlação
      • Interpretando a matriz de correlação
      • Adicionando título e rótulos ao gráfico
      • Classificando a matriz de correlação
      • Seleção de pares de correlação negativa

Introdução ao Machine Learning

  • Como iniciar um projeto de aprendizado de máquina em Python

Desenvolvedores, Cientistas de Dados, Analistas de Big Data, curiososTer participado do treinamento Python Foundation (é fundamental o conhecimento em linguagem de programação Python)Curso prático e teórico.

Português ou Inglês.

plugins premium WordPress

Ganhe 5% de desconto

    Inscreva-se agora

      Ganhe 5% de descontos