Questions marquées «dataframe»

Un bloc de données est une structure de données tabulaire. Habituellement, il contient des données où les lignes sont des observations et les colonnes sont des variables de différents types. Alors que "data frame" ou "dataframe" est le terme utilisé pour ce concept dans plusieurs langues (R, Apache Spark, deedle, Maple, la bibliothèque pandas en Python et la bibliothèque DataFrames en Julia), "table" est le terme utilisé dans MATLAB et SQL.

4
dtypes datetime dans pandas read_csv
Je lis dans un fichier csv avec plusieurs colonnes datetime. J'aurais besoin de définir les types de données lors de la lecture du fichier, mais les datetimes semblent être un problème. Par exemple: headers = ['col1', 'col2', 'col3', 'col4'] dtypes = ['datetime', 'datetime', 'str', 'float'] pd.read_csv(file, sep='\t', header=None, names=headers, dtype=dtypes) …


4
Comment former une colonne tuple à partir de deux colonnes dans Pandas
J'ai un Pandas DataFrame et je veux combiner les colonnes «lat» et «long» pour former un tuple. <class 'pandas.core.frame.DataFrame'> Int64Index: 205482 entries, 0 to 209018 Data columns: Month 205482 non-null values Reported by 205482 non-null values Falls within 205482 non-null values Easting 205482 non-null values Northing 205482 non-null values Location …

12
data.frame lignes dans une liste
J'ai un data.frame que je voudrais convertir en une liste par lignes, ce qui signifie que chaque ligne correspondrait à ses propres éléments de liste. En d'autres termes, je voudrais une liste qui est aussi longue que le data.frame a des lignes. Jusqu'à présent, j'ai abordé ce problème de la …
123 list  r  dataframe 


3
Trouvez le nom de la colonne qui a la valeur maximale pour chaque ligne
J'ai un DataFrame comme celui-ci: In [7]: frame.head() Out[7]: Communications and Search Business General Lifestyle 0 0.745763 0.050847 0.118644 0.084746 0 0.333333 0.000000 0.583333 0.083333 0 0.617021 0.042553 0.297872 0.042553 0 0.435897 0.000000 0.410256 0.153846 0 0.358974 0.076923 0.410256 0.153846 Ici, je veux demander comment obtenir le nom de la …
123 python  pandas  dataframe  max 


7
Comment ajouter des lignes à un bloc de données R
J'ai regardé autour de StackOverflow, mais je ne trouve pas de solution spécifique à mon problème, qui consiste à ajouter des lignes à un bloc de données R. J'initialise une trame de données vide à 2 colonnes, comme suit. df = data.frame(x = numeric(), y = character()) Ensuite, mon objectif …
121 r  merge  append  dataframe  rows 


14
Compter le nombre de lignes dans chaque groupe
J'ai un dataframe et je voudrais compter le nombre de lignes dans chaque groupe. J'utilise régulièrement la aggregatefonction pour additionner les données comme suit: df2 <- aggregate(x ~ Year + Month, data = df1, sum) Maintenant, j'aimerais compter les observations mais je n'arrive pas à trouver le bon argument pour …
121 r  dataframe  aggregate  r-faq 



1
Quelles règles les Pandas utilisent-ils pour générer une vue par rapport à une copie?
Je ne comprends pas les règles que Pandas utilise pour décider qu'une sélection à partir d'un dataframe est une copie du dataframe original, ou une vue sur l'original. Si j'ai, par exemple, df = pd.DataFrame(np.random.randn(8,8), columns=list('ABCDEFGH'), index=range(1,9)) Je comprends que a queryrenvoie une copie de sorte que quelque chose comme …

3
Comment tester si une chaîne contient l'une des sous-chaînes d'une liste, dans les pandas?
Y a-t-il une fonction qui équivaudrait à une combinaison de df.isin()et df[col].str.contains()? Par exemple, disons que j'ai la série s = pd.Series(['cat','hat','dog','fog','pet'])et que je veux trouver tous les endroits où scontient l'un des ['og', 'at'], je voudrais tout obtenir sauf «animal de compagnie». J'ai une solution, mais c'est plutôt inélégant: …

5
Passer un nom de colonne data.frame à une fonction
J'essaye d'écrire une fonction pour accepter un data.frame ( x) et un columnde celui-ci. La fonction effectue quelques calculs sur x et retourne plus tard un autre data.frame. Je suis bloqué sur la méthode des meilleures pratiques pour passer le nom de la colonne à la fonction. Les deux exemples …
119 r  dataframe  r-faq 

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.