Questions marquées «pandas»

Pandas est une bibliothèque Python pour la manipulation et l'analyse des données, par exemple les trames de données, les séries chronologiques multidimensionnelles et les jeux de données transversaux que l'on trouve couramment dans les statistiques, les résultats de la science expérimentale, l'économétrie ou la finance. Pandas est l'une des principales bibliothèques de science des données en Python.



1
Stratégies de test de la méthode Pandas read_xml ()
Actuellement, les outils d'E / S pandas ne maintiennent pas de read_xml()méthode et de contrepartie to_xml(). Cependant, cela read_jsonprouve que des structures arborescentes peuvent être implémentées pour l'importation de dataframe et read_htmlpour les formats de balisage. Si l'équipe de pandas géants ne considérer une telle read_xmlméthode pour la future version …
109 python  xml  pandas  xslt  xpath 


11
produit cartésien chez les pandas
J'ai deux dataframes pandas: from pandas import DataFrame df1 = DataFrame({'col1':[1,2],'col2':[3,4]}) df2 = DataFrame({'col3':[5,6]}) Quelle est la meilleure pratique pour obtenir leur produit cartésien (bien sûr sans l'écrire explicitement comme moi)? #df1, df2 cartesian product df_cartesian = DataFrame({'col1':[1,2,1,2],'col2':[3,4,3,4],'col3':[5,5,6,6]})
109 python  pandas 

5
Les pandas Python ne fusionnent que certaines colonnes
Est-il possible de ne fusionner que certaines colonnes? J'ai un DataFrame df1 avec les colonnes x, y, z et df2 avec les colonnes x, a, b, c, d, e, f, etc. Je veux fusionner les deux DataFrames sur x, mais je veux seulement fusionner les colonnes df2.a, df2.b - pas …
109 python  merge  pandas 

4
Changer une valeur en fonction d'une autre valeur dans les pandas
J'essaie de reprogrammer mon code Stata en Python pour des améliorations de vitesse, et j'ai été dirigé vers PANDAS. Cependant, j'ai du mal à comprendre comment traiter les données. Disons que je souhaite parcourir toutes les valeurs de l'en-tête de colonne «ID». Si cet identifiant correspond à un nombre spécifique, …
109 python  pandas 

7
Comment changer le format datetime dans les pandas
Mon dataframe a une DOBcolonne (exemple de format 1/1/2016) qui par défaut est convertie en pandas dtype 'object':DOB object La conversion de ce format de date avec df['DOB'] = pd.to_datetime(df['DOB']), la date est convertie en: 2016-01-26et son dtypeest: DOB datetime64[ns]. Maintenant, je veux convertir ce format de date vers 01/26/2016ou …

5
Lire un fichier zippé en tant que DataFrame pandas
J'essaie de décompresser un fichier csv et de le transmettre aux pandas afin que je puisse travailler sur le fichier. Le code que j'ai essayé jusqu'à présent est: import requests, zipfile, StringIO r = requests.get('http://data.octo.dc.gov/feeds/crime_incidents/archive/crime_incidents_2013_CSV.zip') z = zipfile.ZipFile(StringIO.StringIO(r.content)) crime2013 = pandas.read_csv(z.read('crime_incidents_2013_CSV.csv')) Après la dernière ligne, bien que python soit capable …
108 python  zip  pandas 


4
Pandas chaque nième rangée
Dataframe.resample () fonctionne uniquement avec les données de séries temporelles. Je ne peux pas trouver un moyen d'obtenir chaque nième ligne à partir de données non chronologiques. Quelle est la meilleure méthode?

5
Comment ajouter un titre au boxplot Seaborn
Cela semble assez googleable mais je n'ai pas été en mesure de trouver quelque chose en ligne qui fonctionne. J'ai essayé les deux sns.boxplot('Day', 'Count', data= gg).title('lalala')et sns.boxplot('Day', 'Count', data= gg).suptitle('lalala'). Aucun n'a fonctionné. Je pense que c'est peut-être parce que je travaille également avec matplotlib.

5
Conversion de SQLAlchemy ORM en pandas DataFrame
Ce sujet n'a pas été abordé depuis un moment, ici ou ailleurs. Existe-t-il une solution pour convertir un SQLAlchemy <Query object>en un pandas DataFrame? Pandas a la capacité d'utiliser pandas.read_sqlmais cela nécessite l'utilisation de SQL brut. J'ai deux raisons de vouloir l'éviter: 1) J'ai déjà tout utilisant l'ORM (une bonne …

5
Obtenir le total de la colonne Pandas
Cible J'ai une trame de données Pandas, comme indiqué ci - dessous, avec plusieurs colonnes et que vous souhaitez obtenir le total de la colonne, MyColumn. Trame de données -df: print df X MyColumn Y Z 0 A 84 13.0 69.0 1 B 76 77.0 127.0 2 C 28 69.0 …
107 python  pandas  dataframe  sum 


En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.