Questions marquées «pandas»

Pandas est une bibliothèque Python pour la manipulation et l'analyse des données, par exemple les trames de données, les séries chronologiques multidimensionnelles et les jeux de données transversaux que l'on trouve couramment dans les statistiques, les résultats de la science expérimentale, l'économétrie ou la finance. Pandas est l'une des principales bibliothèques de science des données en Python.

4
Appliquer vs transformer sur un objet de groupe
Considérez le dataframe suivant: A B C D 0 foo one 0.162003 0.087469 1 bar one -1.156319 -1.526272 2 foo two 0.833892 -1.666304 3 bar three -2.026673 -0.322057 4 foo two 0.411452 -0.954371 5 bar two 0.765878 -0.095968 6 foo one -0.654890 0.678091 7 foo three -1.789842 -1.130922 Les commandes …
174 python  pandas 

10
Comment enregistrer un tracé Seaborn dans un fichier
J'ai essayé le code suivant ( test_seaborn.py): import matplotlib matplotlib.use('Agg') import matplotlib.pyplot as plt matplotlib.style.use('ggplot') import seaborn as sns sns.set() df = sns.load_dataset('iris') sns_plot = sns.pairplot(df, hue='species', size=2.5) fig = sns_plot.get_figure() fig.savefig("output.png") #sns.plt.show() Mais j'obtiens cette erreur: Traceback (most recent call last): File "test_searborn.py", line 11, in <module> fig = …


8
Comment imprimer des pandas DataFrame sans index
Je veux imprimer le dataframe entier, mais je ne veux pas imprimer l'index En outre, une colonne est de type datetime, je veux juste imprimer l'heure, pas la date. Le dataframe ressemble à: User ID Enter Time Activity Number 0 123 2014-07-08 00:09:00 1411 1 123 2014-07-08 00:18:00 893 2 …


7
Comment filtrer les lignes dans les pandas par regex
Je voudrais filtrer proprement un dataframe à l'aide de regex sur l'une des colonnes. Pour un exemple artificiel: In [210]: foo = pd.DataFrame({'a' : [1,2,3,4], 'b' : ['hi', 'foo', 'fat', 'cat']}) In [211]: foo Out[211]: a b 0 1 hi 1 2 foo 2 3 fat 3 4 cat Je …
169 python  regex  pandas 

3
pandas: fusionner (joindre) deux cadres de données sur plusieurs colonnes
J'essaie de joindre deux cadres de données pandas en utilisant deux colonnes: new_df = pd.merge(A_df, B_df, how='left', left_on='[A_c1,c2]', right_on = '[B_c1,c2]') mais j'ai l'erreur suivante: pandas/index.pyx in pandas.index.IndexEngine.get_loc (pandas/index.c:4164)() pandas/index.pyx in pandas.index.IndexEngine.get_loc (pandas/index.c:4028)() pandas/src/hashtable_class_helper.pxi in pandas.hashtable.PyObjectHashTable.get_item (pandas/hashtable.c:13166)() pandas/src/hashtable_class_helper.pxi in pandas.hashtable.PyObjectHashTable.get_item (pandas/hashtable.c:13120)() KeyError: '[B_1, c2]' Avez-vous une idée de la bonne …



5
pandas groupby tri dans les groupes
Je souhaite regrouper mon dataframe sur deux colonnes, puis trier les résultats agrégés au sein des groupes. In [167]: df Out[167]: count job source 0 2 sales A 1 4 sales B 2 6 sales C 3 3 sales D 4 7 sales E 5 5 market A 6 3 …

6
Pandas DataFrame Groupby deux colonnes et obtenir des comptes
J'ai un dataframe pandas au format suivant: df = pd.DataFrame([[1.1, 1.1, 1.1, 2.6, 2.5, 3.4,2.6,2.6,3.4,3.4,2.6,1.1,1.1,3.3], list('AAABBBBABCBDDD'), [1.1, 1.7, 2.5, 2.6, 3.3, 3.8,4.0,4.2,4.3,4.5,4.6,4.7,4.7,4.8], ['x/y/z','x/y','x/y/z/n','x/u','x','x/u/v','x/y/z','x','x/u/v/b','-','x/y','x/y/z','x','x/u/v/w'],['1','3','3','2','4','2','5','3','6','3','5','1','1','1']]).T df.columns = ['col1','col2','col3','col4','col5'] df: col1 col2 col3 col4 col5 0 1.1 A 1.1 x/y/z 1 1 1.1 A 1.7 x/y 3 2 1.1 A 2.5 x/y/z/n 3 …
166 python  pandas  dataframe 

4
Comment ajouter une ligne d'en-tête à un DataFrame Pandas
Je lis un fichier csv dans pandas. Ce fichier csv se compose de quatre colonnes et de quelques lignes, mais n'a pas de ligne d'en-tête, que je souhaite ajouter. J'ai essayé ce qui suit: Cov = pd.read_csv("path/to/file.txt", sep='\t') Frame=pd.DataFrame([Cov], columns = ["Sequence", "Start", "End", "Coverage"]) Frame.to_csv("path/to/file.txt", sep='\t') Mais lorsque j'applique …
166 python  csv  pandas  header 

7
Comment afficher les pandas DataFrame de flotteurs en utilisant une chaîne de format pour les colonnes?
Je voudrais afficher un dataframe pandas avec un format donné en utilisant print()et IPython display(). Par exemple: df = pd.DataFrame([123.4567, 234.5678, 345.6789, 456.7890], index=['foo','bar','baz','quux'], columns=['cost']) print df cost foo 123.4567 bar 234.5678 baz 345.6789 quux 456.7890 Je voudrais en quelque sorte contraindre cela à l'impression cost foo $123.46 bar $234.57 …

4
Pandas DataFrame à la liste des dictionnaires
J'ai le DataFrame suivant: article client1 article2 article3 1 tomate au lait de pomme 2 pommes de terre orange d'eau 3 chips de jus de mangue dont je veux le traduire en liste de dictionnaires par ligne rows = [{'customer': 1, 'item1': 'apple', 'item2': 'milk', 'item3': 'tomato'}, {'customer': 2, 'item1': …


En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.