Comment récupérez-vous par programme le nombre de colonnes dans un dataframe pandas? J'espérais quelque chose comme:
df.num_columns
Comment récupérez-vous par programme le nombre de colonnes dans un dataframe pandas? J'espérais quelque chose comme:
df.num_columns
Réponses:
Ainsi:
import pandas as pd
df = pd.DataFrame({"pear": [1,2,3], "apple": [2,3,4], "orange": [3,4,5]})
len(df.columns)
3
df.shape
c'est mieux? je suppose qu'il n'appelle pas une fonction mais lit simplement l'attribut de la mémoire?
Alternative:
df.shape[1]
( df.shape[0]
est le nombre de lignes)
Si la variable contenant le dataframe est appelée df, alors:
len(df.columns)
donne le nombre de colonnes.
Et pour ceux qui veulent le nombre de lignes:
len(df.index)
Pour un tuple contenant le nombre de lignes et de colonnes:
df.shape
len(df)
vous donnerait pas les lignes?
Cela a fonctionné pour moi len (list (df)).
La fonction df.info () vous donnera un résultat comme ci-dessous. Si vous utilisez la méthode read_csv de Pandas sans paramètre sep ou sep avec ",".
raw_data = pd.read_csv("a1:\aa2/aaa3/data.csv")
raw_data.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 5144 entries, 0 to 5143
Columns: 145 entries, R_fighter to R_age
Il existe plusieurs options pour obtenir le numéro de colonne et les informations de colonne telles que:
vérifions-les.
local_df = pd.DataFrame (np.random.randint (1,12, taille = (2,6)), colonnes = ['a', 'b', 'c', 'd', 'e', 'f ']) 1. local_df.shape [1] -> L'attribut Shape renvoie le tuple comme (ligne et colonnes) (0,1).
local_df.info () -> La méthode info renverra des informations détaillées sur le bloc de données et ses colonnes, comme le nombre de colonnes, le type de données des colonnes, le nombre de valeurs non nulles, l'utilisation de la mémoire par le bloc de données
len (local_df.columns) -> L'attribut columns renverra l'objet d'index des colonnes du bloc de données et la fonction len renverra le total des colonnes disponibles.
local_df.head (0) -> la méthode head avec le paramètre 0 retournera la 1ère ligne de df qui en fait rien d'autre que l'en-tête.
En supposant que le nombre de colonnes ne dépasse pas 10. Pour le plaisir de la boucle: li_count = 0 pour x dans local_df: li_count = li_count + 1 print (li_count)
df.shape
donne un tuple avec (n_rows, n_columns)