Questions marquées «dataframe»

Un bloc de données est une structure de données tabulaire. Habituellement, il contient des données où les lignes sont des observations et les colonnes sont des variables de différents types. Alors que "data frame" ou "dataframe" est le terme utilisé pour ce concept dans plusieurs langues (R, Apache Spark, deedle, Maple, la bibliothèque pandas en Python et la bibliothèque DataFrames en Julia), "table" est le terme utilisé dans MATLAB et SQL.





5
Créer un Pandas DataFrame vide, puis le remplir?
Je commence à partir des documents pandas DataFrame ici: http://pandas.pydata.org/pandas-docs/stable/dsintro.html Je voudrais remplir le DataFrame de manière itérative avec des valeurs dans un type de calcul de série chronologique. Donc, fondamentalement, je voudrais initialiser le DataFrame avec les colonnes A, B et les lignes d'horodatage, toutes 0 ou toutes NaN. …
463 python  dataframe  pandas 





7
Obtenez des statistiques pour chaque groupe (comme le nombre, la moyenne, etc.) à l'aide de pandas GroupBy?
J'ai un bloc de données dfet j'utilise plusieurs colonnes pour groupby: df['col1','col2','col3','col4'].groupby(['col1','col2']).mean() De la manière ci-dessus, j'obtiens presque la table (trame de données) dont j'ai besoin. Ce qui manque, c'est une colonne supplémentaire qui contient le nombre de lignes dans chaque groupe. En d'autres termes, je veux dire, mais j'aimerais …

7
Comment filtrer la trame de données Pandas en utilisant 'in' et 'not in' comme dans SQL
Comment puis-je atteindre les équivalents de SQL INetNOT IN ? J'ai une liste avec les valeurs requises. Voici le scénario: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = ['UK','China'] # pseudo-code: df[df['countries'] not in countries] Ma façon actuelle de procéder est la suivante: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = pd.DataFrame({'countries':['UK','China'], 'matched':True}) # IN df.merge(countries,how='inner',on='countries') …

18
UnicodeDecodeError lors de la lecture d'un fichier CSV dans Pandas avec Python
J'exécute un programme qui traite 30 000 fichiers similaires. Un nombre aléatoire d'entre eux s'arrêtent et produisent cette erreur ... File "C:\Importer\src\dfman\importer.py", line 26, in import_chr data = pd.read_csv(filepath, names=fields) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 400, in parser_f return _read(filepath_or_buffer, kwds) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 205, in _read return parser.read() File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line …


16
Modification des noms de colonne d'un bloc de données
J'ai un bloc de données appelé "nouveau prix" (voir ci-dessous) et je veux changer les noms de colonnes dans mon programme en R. > newprice Chang. Chang. Chang. 1 100 36 136 2 120 -33 87 3 150 14 164 En fait, c'est ce que je fais: names(newprice)[1]<-paste("premium") names(newprice)[2]<-paste("change") names(newprice)[3]<-paste("newprice") …
400 r  dataframe  rename 


En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.