Sachez que np.array_split(df, 3)
le dataframe divise en 3 sous-dataframes, tandis que la split_dataframe
fonction définie dans la réponse de @ elixir , lorsqu'elle est appelée en tant que split_dataframe(df, chunk_size=3)
, divise le dataframe toutes les chunk_size
lignes.
Exemple:
Avec np.array_split
:
df = pd.DataFrame([1,2,3,4,5,6,7,8,9,10,11], columns=['TEST'])
df_split = np.array_split(df, 3)
... vous obtenez 3 sous-dataframes:
df_split[0]
df_split[1]
df_split[2]
Avec split_dataframe
:
df_split2 = split_dataframe(df, chunk_size=3)
... vous obtenez 4 sous-dataframes:
df_split2[0]
df_split2[1]
df_split2[2]
df_split2[3]
J'espère que j'ai raison, et que cela est utile.
np.split(df, N)
fonction s'il vous plaît.