extrait du document pandas http://pandas.pydata.org/pandas-docs/stable/dsintro.html
Series est un tableau étiqueté unidimensionnel capable de contenir n'importe quel type de données. Pour lire les données sous forme de série panda:
import pandas as pd
ds = pd.Series(data, index=index)
DataFrame est une structure de données étiquetée en 2 dimensions avec des colonnes de types potentiellement différents.
import pandas as pd
df = pd.DataFrame(data, index=index)
Dans les deux index ci-dessus se trouve la liste
par exemple: j'ai un fichier csv avec les données suivantes:
,country,popuplation,area,capital
BR,Brazil,10210,12015,Brasile
RU,Russia,1025,457,Moscow
IN,India,10458,457787,New Delhi
Pour lire les données ci-dessus sous forme de série et de bloc de données:
import pandas as pd
file_data = pd.read_csv("file_path", index_col=0)
d = pd.Series(file_data.country, index=['BR','RU','IN'] or index = file_data.index)
production:
>>> d
BR Brazil
RU Russia
IN India
df = pd.DataFrame(file_data.area, index=['BR','RU','IN'] or index = file_data.index )
production:
>>> df
area
BR 12015
RU 457
IN 457787