Python - Série Temporal

A série temporal é uma série de pontos de dados em que cada ponto de dados está associado a um carimbo de data / hora. Um exemplo simples é o preço de uma ação no mercado de ações em diferentes pontos do tempo em um determinado dia. Outro exemplo é a quantidade de chuvas em uma região em diferentes meses do ano.

No exemplo abaixo, pegamos o valor dos preços das ações todos os dias durante um trimestre para um determinado símbolo de ação. Capturamos esses valores como um arquivo csv e os organizamos em um dataframe usando a biblioteca do pandas. Em seguida, definimos o campo de data como índice do dataframe recriando a coluna Valuedate adicional como índice e excluindo a coluna de valor anterior.

Dados de amostra

Abaixo estão os dados de amostra para o preço da ação em diferentes dias de um determinado trimestre. Os dados são salvos em um arquivo denominado stock.csv

ValueDate	Price
01-01-2018,	1042.05
02-01-2018,	1033.55
03-01-2018,	1029.7
04-01-2018,	1021.3
05-01-2018,	1015.4
...
...
...
...
23-03-2018,	1161.3
26-03-2018,	1167.6
27-03-2018,	1155.25
28-03-2018,	1154

Criando Séries Temporais

from datetime import datetime
import pandas as pd
import matplotlib.pyplot as plt

data = pd.read_csv('path_to_file/stock.csv')
df = pd.DataFrame(data, columns = ['ValueDate', 'Price'])

# Set the Date as Index
df['ValueDate'] = pd.to_datetime(df['ValueDate'])
df.index = df['ValueDate']
del df['ValueDate']


df.plot(figsize=(15, 6))
plt.show()

Está output é o seguinte -