Python Pandas - Introdução

Pandas é uma biblioteca Python de código aberto que fornece manipulação de dados de alto desempenho e ferramenta de análise usando suas poderosas estruturas de dados. O nome Pandas é derivado da palavra Panel Data - uma Econometria de dados multidimensionais.

Em 2008, o desenvolvedor Wes McKinney começou a desenvolver pandas quando precisava de uma ferramenta flexível de alto desempenho para análise de dados.

Antes do Pandas, Python era usado principalmente para preparação e preparação de dados. Teve muito pouca contribuição para a análise de dados. O Pandas resolveu esse problema. Usando o Pandas, podemos realizar cinco etapas típicas no processamento e análise de dados, independentemente da origem dos dados - carregar, preparar, manipular, modelar e analisar.

Python com Pandas é usado em uma ampla variedade de campos, incluindo domínios acadêmicos e comerciais, incluindo finanças, economia, estatística, análise, etc.

Principais recursos do Pandas

  • Objeto DataFrame rápido e eficiente com indexação padrão e personalizada.
  • Ferramentas para carregar dados em objetos de dados na memória de diferentes formatos de arquivo.
  • Alinhamento de dados e tratamento integrado de dados ausentes.
  • Remodelagem e rotação de conjuntos de datas.
  • Fatiamento baseado em rótulo, indexação e subconjunto de grandes conjuntos de dados.
  • As colunas de uma estrutura de dados podem ser excluídas ou inseridas.
  • Agrupe por dados para agregação e transformações.
  • Mesclagem e junção de dados de alto desempenho.
  • Funcionalidade de série temporal.