Questions marquées «pandas»

Pandas est une bibliothèque Python pour la manipulation et l'analyse des données, par exemple les trames de données, les séries chronologiques multidimensionnelles et les jeux de données transversaux que l'on trouve couramment dans les statistiques, les résultats de la science expérimentale, l'économétrie ou la finance. Pandas est l'une des principales bibliothèques de science des données en Python.

5
Supprimez les lignes contenant des cellules vides d'un pandas DataFrame
J'ai un pd.DataFramequi a été créé en analysant des feuilles de calcul Excel. Une colonne qui contient des cellules vides. Par exemple, ci-dessous se trouve la sortie pour la fréquence de cette colonne, 32320 enregistrements ont des valeurs manquantes pour Tenant . >>> value_counts(Tenant, normalize=False) 32320 Thunderhead 8170 Big Data …
87 python  pandas 


13
ValueError: numpy.dtype a la mauvaise taille, essayez de recompiler
Je viens d'installer le paquet pandas et statsmodels sur mon python 2.7 Quand j'ai essayé "importer des pandas en tant que pd", ce message d'erreur apparaît. Quelqu'un peut-il aider? Merci!!! numpy.dtype has the wrong size, try recompiling Traceback (most recent call last): File "<stdin>", line 1, in <module> File "C:\analytics\ext\python27\lib\site-packages\statsmodels-0.5.0-py2.7-win32.egg\statsmodels\formula\__init__.py", …

8
Diviser une grande trame de données pandas
J'ai une grande trame de données avec 423244 lignes. Je veux diviser ceci en 4. J'ai essayé le code suivant qui a donné une erreur?ValueError: array split does not result in an equal division for item in np.split(df, 4): print item Comment diviser ce dataframe en 4 groupes?
86 python  pandas 

3
Bug étrange dans Pandas et Numpy concernant le multithreading
La plupart des fonctions de Numpy activent le multithreading par défaut. par exemple, je travaille sur un poste de travail cpu Intel à 8 cœurs, si je lance un script import numpy as np x=np.random.random(1000000) for i in range(100000): np.sqrt(x) Linux topaffichera une utilisation de 800% du processeur pendant l'exécution, …
25 python  pandas  numpy 


7
Vérifiez si la colonne pandas contient tous les éléments d'une liste
J'ai un df comme ça: frame = pd.DataFrame({'a' : ['a,b,c', 'a,c,f', 'b,d,f','a,z,c']}) Et une liste d'articles: letters = ['a','c'] Mon objectif est d’obtenir toutes les lignes framecontenant au moins les 2 élémentsletters J'ai trouvé cette solution: for i in letters: subframe = frame[frame['a'].str.contains(i)] Cela me donne ce que je veux, …
20 python  pandas 



3
Comment convertir un cadre de données pandas en dictionnaire hiérarchique
J'ai le cadre de données pandas suivant: df1 = pd.DataFrame({'date': [200101,200101,200101,200101,200102,200102,200102,200102],'blockcount': [1,1,2,2,1,1,2,2],'reactiontime': [350,400,200,250,100,300,450,400]}) J'essaie de créer un dictionnaire hiérarchique, avec les valeurs du dictionnaire intégré sous forme de listes, qui ressemble à ceci: {200101: {1:[350, 400], 2:[200, 250]}, 200102: {1:[100, 300], 2:[450, 400]}} Comment pourrais-je faire ça? Le plus proche …
16 python  pandas 



6
Trouvez rapidement des paires symétriques dans numpy
from itertools import product import pandas as pd df = pd.DataFrame.from_records(product(range(10), range(10))) df = df.sample(90) df.columns = "c1 c2".split() df = df.sort_values(df.columns.tolist()).reset_index(drop=True) # c1 c2 # 0 0 0 # 1 0 1 # 2 0 2 # 3 0 3 # 4 0 4 # .. .. .. # …
15 python  pandas  numpy 

3
Obtenez la distance la plus proche avec deux géodonnées dans des pandas
Voici mon premier géodatframe: !pip install geopandas import pandas as pd import geopandas city1 = [{'City':"Buenos Aires","Country":"Argentina","Latitude":-34.58,"Longitude":-58.66}, {'City':"Brasilia","Country":"Brazil","Latitude":-15.78 ,"Longitude":-70.66}, {'City':"Santiago","Country":"Chile ","Latitude":-33.45 ,"Longitude":-70.66 }] city2 = [{'City':"Bogota","Country":"Colombia ","Latitude":4.60 ,"Longitude":-74.08}, {'City':"Caracas","Country":"Venezuela","Latitude":10.48 ,"Longitude":-66.86}] city1df = pd.DataFrame(city1) city2df = pd.DataFrame(city2) gcity1df = geopandas.GeoDataFrame( city1df, geometry=geopandas.points_from_xy(city1df.Longitude, city1df.Latitude)) gcity2df = geopandas.GeoDataFrame( city2df, geometry=geopandas.points_from_xy(city2df.Longitude, city2df.Latitude)) Ville1 City …


En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.