Questions marquées «pandas»

Pandas est une bibliothèque Python pour la manipulation et l'analyse des données, par exemple les trames de données, les séries chronologiques multidimensionnelles et les jeux de données transversaux que l'on trouve couramment dans les statistiques, les résultats de la science expérimentale, l'économétrie ou la finance. Pandas est l'une des principales bibliothèques de science des données en Python.

8
Les pandas peuvent-ils tracer un histogramme des dates?
J'ai pris ma série et l'ai forcée à une colonne datetime de dtype = datetime64[ns](bien que seule la résolution du jour soit nécessaire ... je ne sais pas comment changer). import pandas as pd df = pd.read_csv('somefile.csv') column = df['date'] column = pd.to_datetime(column, coerce=True) mais le traçage ne fonctionne pas: …

7
Comparez deux colonnes à l'aide de pandas
En utilisant ceci comme point de départ: a = [['10', '1.2', '4.2'], ['15', '70', '0.03'], ['8', '5', '0']] df = pd.DataFrame(a, columns=['one', 'two', 'three']) Out[8]: one two three 0 10 1.2 4.2 1 15 70 0.03 2 8 5 0 Je veux utiliser quelque chose comme une ifdéclaration dans les …




9
Renvoie plusieurs colonnes de pandas apply ()
J'ai un dataframe pandas géants, df_test. Il contient une colonne «taille» qui représente la taille en octets. J'ai calculé Ko, Mo et Go à l'aide du code suivant: df_test = pd.DataFrame([ {'dir': '/Users/uname1', 'size': 994933}, {'dir': '/Users/uname2', 'size': 109338711}, ]) df_test['size_kb'] = df_test['size'].astype(int).apply(lambda x: locale.format("%.1f", x / 1024.0, grouping=True) + …

6
Créer une trame de données pandas remplie de zéro
Quelle est la meilleure façon de créer une trame de données pandas remplie de zéro d'une taille donnée? J'ai utilisé: zero_data = np.zeros(shape=(len(data),len(feature_list))) d = pd.DataFrame(zero_data, columns=feature_list) Y a-t-il une meilleure façon de le faire?
103 python  pandas  dataframe 

2
L'objet 'DataFrame' n'a pas d'attribut 'sort'
Je rencontre un problème ici, dans mon package python, j'ai installé numpy, mais j'ai toujours cette erreur 'DataFrame' object has no attribute 'sort' Tout le monde peut me donner une idée. Voici mon code: final.loc[-1] =['', 'P','Actual'] final.index = final.index + 1 # shifting index final = final.sort() final.columns=[final.columns,final.iloc[0]] final …


7
tracer différentes couleurs pour différents niveaux catégoriels en utilisant matplotlib
J'ai cette trame de données diamondsqui est composé de variables telles que (carat, price, color), et je veux dessiner un diagramme de dispersion priceà caratchaque color, ce qui signifie différent colora une couleur différente dans la parcelle. C'est facile Ravec ggplot: ggplot(aes(x=carat, y=price, color=color), #by setting color=color, ggplot automatically draw …


5
Sélection de la colonne pandas par emplacement
J'essaie simplement d'accéder aux colonnes pandas nommées par un entier. Vous pouvez sélectionner une ligne par emplacement à l'aide de df.ix[3]. Mais comment sélectionner une colonne par entier? Mon dataframe: df=pandas.DataFrame({'a':np.random.rand(5), 'b':np.random.rand(5)})
101 python  pandas  indexing 

7
Comment déplacer une colonne dans Pandas DataFrame
Je voudrais déplacer une colonne dans un Pandas DataFrame, mais je n'ai pas été en mesure de trouver une méthode pour le faire à partir de la documentation sans réécrire l'ensemble du DF. Quelqu'un sait-il comment le faire? Trame de données: ## x1 x2 ##0 206 214 ##1 226 234 …
101 python  pandas  dataframe 

4
Numpy isnan () échoue sur un tableau de flottants (à partir de pandas dataframe s'appliquent)
J'ai un tableau de flotteurs (certains nombres normaux, certains nans) qui sortent d'une application sur un dataframe pandas. Pour une raison quelconque, numpy.isnan échoue sur ce tableau, mais comme indiqué ci-dessous, chaque élément est un flottant, numpy.isnan s'exécute correctement sur chaque élément, le type de la variable est définitivement un …
101 python  arrays  numpy  pandas 

5
Ajouter un niveau à un pandas MultiIndex
J'ai un DataFrame avec un MultiIndex créé après un certain regroupement: import numpy as np import pandas as p from numpy.random import randn df = p.DataFrame({ 'A' : ['a1', 'a1', 'a2', 'a3'] , 'B' : ['b1', 'b2', 'b3', 'b4'] , 'Vals' : randn(4) }).groupby(['A', 'B']).sum() df Output> Vals Output> A …
101 python  pandas 

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.