Questions marquées «pandas»

Pandas est une bibliothèque Python pour la manipulation et l'analyse des données, par exemple les trames de données, les séries chronologiques multidimensionnelles et les jeux de données transversaux que l'on trouve couramment dans les statistiques, les résultats de la science expérimentale, l'économétrie ou la finance. Pandas est l'une des principales bibliothèques de science des données en Python.

13
Comment imprimer un objet groupby
Je veux imprimer le résultat du regroupement avec Pandas. J'ai un dataframe: import pandas as pd df = pd.DataFrame({'A': ['one', 'one', 'two', 'three', 'three', 'one'], 'B': range(6)}) print(df) A B 0 one 0 1 one 1 2 two 2 3 three 3 4 three 4 5 one 5 Lors de …
134 python  pandas 

6
comment vérifier le dtype d'une colonne dans les pandas python
J'ai besoin d'utiliser différentes fonctions pour traiter les colonnes numériques et les colonnes de chaînes. Ce que je fais maintenant est vraiment stupide: allc = list((agg.loc[:, (agg.dtypes==np.float64)|(agg.dtypes==np.int)]).columns) for y in allc: treat_numeric(agg[y]) allc = list((agg.loc[:, (agg.dtypes!=np.float64)&(agg.dtypes!=np.int)]).columns) for y in allc: treat_str(agg[y]) Y a-t-il une manière plus élégante de faire cela? …
134 python  pandas 

4
Pandas Python: remplissez un dataframe ligne par ligne
La simple tâche d'ajouter une ligne à un pandas.DataFrameobjet semble être difficile à accomplir. Il y a 3 questions de stackoverflow liées à cela, dont aucune ne donne de réponse fonctionnelle. Voici ce que j'essaye de faire. J'ai un DataFrame dont je connais déjà la forme ainsi que les noms …
133 python  dataframe  row  pandas 

10
Les pandas convertissent la trame de données en tableau de tuples
J'ai manipulé certaines données à l'aide de pandas et je souhaite maintenant effectuer une sauvegarde par lots dans la base de données. Cela m'oblige à convertir le dataframe en un tableau de tuples, chaque tuple correspondant à une "ligne" du dataframe. Mon DataFrame ressemble à quelque chose comme: In [182]: …
132 python  pandas 



5
Normaliser les données dans les pandas
Supposons que j'ai une trame de données pandas df : Je veux calculer la moyenne par colonne d'un bloc de données. C'est facile: df.apply(average) puis la plage par colonne max (col) - min (col). C'est encore facile: df.apply(max) - df.apply(min) Maintenant, pour chaque élément, je veux soustraire la moyenne de …
131 python  pandas  numpy 

3
quel est le moyen le plus efficace de compter les occurrences chez les pandas?
J'ai un grand (environ 12M lignes) dataframe df avec disons: df.columns = ['word','documents','frequency'] Ainsi, ce qui suit s'est déroulé en temps opportun: word_grouping = df[['word','frequency']].groupby('word') MaxFrequency_perWord = word_grouping[['frequency']].max().reset_index() MaxFrequency_perWord.columns = ['word','MaxFrequency'] Cependant, cela prend un temps inattendu à s'exécuter: Occurrences_of_Words = word_grouping[['word']].count().reset_index() Qu'est-ce que je fais de mal ici? Existe-t-il …
131 python  pandas 

2
vérifier si la variable est dataframe
quand ma fonction f est appelée avec une variable, je veux vérifier si var est un dataframe pandas: def f(var): if var == pd.DataFrame(): print "do stuff" Je suppose que la solution peut être assez simple mais même avec def f(var): if var.values != None: print "do stuff" Je ne …
131 python  pandas 



4
Concaténer une liste de dataframes pandas ensemble
J'ai une liste de dataframes Pandas que je voudrais combiner en une dataframe Pandas. J'utilise Python 2.7.10 et Pandas 0.16.2 J'ai créé la liste des dataframes à partir de: import pandas as pd dfs = [] sqlall = "select * from mytable" for chunk in pd.read_sql_query(sqlall , cnxn, chunksize=10000): dfs.append(chunk) …



5
Ajouter des dates manquantes à la base de données pandas
Mes données peuvent avoir plusieurs événements à une date donnée ou AUCUN événement à une date. Je prends ces événements, j'obtiens un décompte par date et je les trace. Cependant, lorsque je les trace, mes deux séries ne correspondent pas toujours. idx = pd.date_range(df['simpleDate'].min(), df['simpleDate'].max()) s = df.groupby(['simpleDate']).size() Dans le …
128 python  date  plot  pandas  dataframe 

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.