Python Pandas - Série
Series é um array rotulado unidimensional capaz de conter dados de qualquer tipo (inteiro, string, float, objetos python, etc.). Os rótulos dos eixos são chamados coletivamente de índice.
pandas.Series
Uma série pandas pode ser criada usando o seguinte construtor -
pandas.Series( data, index, dtype, copy)
Os parâmetros do construtor são os seguintes -
Sr. Não | Parâmetro e Descrição |
---|---|
1 | data os dados assumem várias formas, como ndarray, lista, constantes |
2 | index Os valores do índice devem ser únicos e hashable, mesmo comprimento que os dados. Padrãonp.arrange(n) se nenhum índice for passado. |
3 | dtype dtype é para tipo de dados. Se nenhum, o tipo de dados será inferido |
4 | copy Copie os dados. Falso padrão |
Uma série pode ser criada usando várias entradas como -
- Array
- Dict
- Valor escalar ou constante
Crie uma série vazia
Uma série básica que pode ser criada é uma série vazia.
Exemplo
#import the pandas library and aliasing as pd
import pandas as pd
s = pd.Series()
print s
Está output é o seguinte -
Series([], dtype: float64)
Crie uma série de ndarray
Se os dados forem um ndarray, o índice transmitido deve ter o mesmo comprimento. Se nenhum índice for passado, então, por padrão, o índice serárange(n) Onde n é o comprimento da matriz, ou seja, [0,1,2,3…. range(len(array))-1].
Exemplo 1
#import the pandas library and aliasing as pd
import pandas as pd
import numpy as np
data = np.array(['a','b','c','d'])
s = pd.Series(data)
print s
Está output é o seguinte -
0 a
1 b
2 c
3 d
dtype: object
Não passamos nenhum índice, então, por padrão, ele atribuiu os índices que variam de 0 a len(data)-1, ou seja, 0 a 3.
Exemplo 2
#import the pandas library and aliasing as pd
import pandas as pd
import numpy as np
data = np.array(['a','b','c','d'])
s = pd.Series(data,index=[100,101,102,103])
print s
Está output é o seguinte -
100 a
101 b
102 c
103 d
dtype: object
Passamos os valores do índice aqui. Agora podemos ver os valores indexados personalizados na saída.
Crie uma série de dict
UMA dictpode ser passado como entrada e, se nenhum índice for especificado, as chaves do dicionário são obtidas em uma ordem de classificação para construir o índice. E seindex for passado, os valores nos dados correspondentes aos rótulos no índice serão retirados.
Exemplo 1
#import the pandas library and aliasing as pd
import pandas as pd
import numpy as np
data = {'a' : 0., 'b' : 1., 'c' : 2.}
s = pd.Series(data)
print s
Está output é o seguinte -
a 0.0
b 1.0
c 2.0
dtype: float64
Observe - As chaves de dicionário são usadas para construir o índice.
Exemplo 2
#import the pandas library and aliasing as pd
import pandas as pd
import numpy as np
data = {'a' : 0., 'b' : 1., 'c' : 2.}
s = pd.Series(data,index=['b','c','d','a'])
print s
Está output é o seguinte -
b 1.0
c 2.0
d NaN
a 0.0
dtype: float64
Observe - A ordem do índice é persistida e o elemento ausente é preenchido com NaN (não é um número).
Crie uma série a partir do escalar
Se os dados forem um valor escalar, um índice deve ser fornecido. O valor será repetido para corresponder ao comprimento deindex
#import the pandas library and aliasing as pd
import pandas as pd
import numpy as np
s = pd.Series(5, index=[0, 1, 2, 3])
print s
Está output é o seguinte -
0 5
1 5
2 5
3 5
dtype: int64
Acessando Dados de Série com Posição
Os dados da série podem ser acessados da mesma forma que em um ndarray.
Exemplo 1
Recupere o primeiro elemento. Como já sabemos, a contagem começa do zero para a matriz, o que significa que o primeiro elemento é armazenado em zero ª posição e assim por diante.
import pandas as pd
s = pd.Series([1,2,3,4,5],index = ['a','b','c','d','e'])
#retrieve the first element
print s[0]
Está output é o seguinte -
1
Exemplo 2
Recupere os três primeiros elementos da Série. Se um: for inserido na frente dele, todos os itens desse índice em diante serão extraídos. Se dois parâmetros (com: entre eles) forem usados, os itens entre os dois índices (sem incluir o índice de parada)
import pandas as pd
s = pd.Series([1,2,3,4,5],index = ['a','b','c','d','e'])
#retrieve the first three element
print s[:3]
Está output é o seguinte -
a 1
b 2
c 3
dtype: int64
Exemplo 3
Recupere os últimos três elementos.
import pandas as pd
s = pd.Series([1,2,3,4,5],index = ['a','b','c','d','e'])
#retrieve the last three element
print s[-3:]
Está output é o seguinte -
c 3
d 4
e 5
dtype: int64
Recuperar dados usando rótulo (índice)
Série A é como um tamanho fixo dict em que você pode obter e definir valores por rótulo de índice.
Exemplo 1
Recupere um único elemento usando o valor do rótulo do índice.
import pandas as pd
s = pd.Series([1,2,3,4,5],index = ['a','b','c','d','e'])
#retrieve a single element
print s['a']
Está output é o seguinte -
1
Exemplo 2
Recupere vários elementos usando uma lista de valores de rótulo de índice.
import pandas as pd
s = pd.Series([1,2,3,4,5],index = ['a','b','c','d','e'])
#retrieve multiple elements
print s[['a','c','d']]
Está output é o seguinte -
a 1
c 3
d 4
dtype: int64
Exemplo 3
Se um rótulo não estiver contido, uma exceção será levantada.
import pandas as pd
s = pd.Series([1,2,3,4,5],index = ['a','b','c','d','e'])
#retrieve multiple elements
print s['f']
Está output é o seguinte -
…
KeyError: 'f'