Python Pandas - Introdução

Pandas é uma biblioteca Python de código aberto que fornece manipulação de dados de alto desempenho e ferramenta de análise usando suas poderosas estruturas de dados. O nome Pandas é derivado da palavra Panel Data - uma Econometria de dados multidimensionais.

Em 2008, o desenvolvedor Wes McKinney começou a desenvolver pandas quando precisava de uma ferramenta flexível de alto desempenho para análise de dados.

Antes do Pandas, Python era usado principalmente para preparação e preparação de dados. Teve muito pouca contribuição para a análise de dados. O Pandas resolveu esse problema. Usando o Pandas, podemos realizar cinco etapas típicas no processamento e análise de dados, independentemente da origem dos dados - carregar, preparar, manipular, modelar e analisar.

Python com Pandas é usado em uma ampla variedade de campos, incluindo domínios acadêmicos e comerciais, incluindo finanças, economia, estatística, análise, etc.

Principais recursos do Pandas

Objeto DataFrame rápido e eficiente com indexação padrão e personalizada.
Ferramentas para carregar dados em objetos de dados na memória de diferentes formatos de arquivo.
Alinhamento de dados e tratamento integrado de dados ausentes.
Remodelagem e rotação de conjuntos de datas.
Fatiamento baseado em rótulo, indexação e subconjunto de grandes conjuntos de dados.
As colunas de uma estrutura de dados podem ser excluídas ou inseridas.
Agrupe por dados para agregação e transformações.
Mesclagem e junção de dados de alto desempenho.
Funcionalidade de série temporal.

↰ Previous page Next page ↱