Questions marquées «dataframe»

Un bloc de données est une structure de données tabulaire. Habituellement, il contient des données où les lignes sont des observations et les colonnes sont des variables de différents types. Alors que "data frame" ou "dataframe" est le terme utilisé pour ce concept dans plusieurs langues (R, Apache Spark, deedle, Maple, la bibliothèque pandas en Python et la bibliothèque DataFrames en Julia), "table" est le terme utilisé dans MATLAB et SQL.

2
L'objet 'DataFrame' n'a pas d'attribut 'sort'
Je rencontre un problème ici, dans mon package python, j'ai installé numpy, mais j'ai toujours cette erreur 'DataFrame' object has no attribute 'sort' Tout le monde peut me donner une idée. Voici mon code: final.loc[-1] =['', 'P','Actual'] final.index = final.index + 1 # shifting index final = final.sort() final.columns=[final.columns,final.iloc[0]] final …


8
Nettoyage des valeurs "Inf" d'une trame de données R
Dans R, j'ai une opération qui crée des Infvaleurs lorsque je transforme un dataframe. Je voudrais transformer ces Infvaleurs en NAvaleurs. Le code que j'ai est lent pour les données volumineuses, existe-t-il un moyen plus rapide de le faire? Disons que j'ai le dataframe suivant: dat <- data.frame(a=c(1, Inf), b=c(Inf, …
101 r  dataframe  data.table 

7
Comment déplacer une colonne dans Pandas DataFrame
Je voudrais déplacer une colonne dans un Pandas DataFrame, mais je n'ai pas été en mesure de trouver une méthode pour le faire à partir de la documentation sans réécrire l'ensemble du DF. Quelqu'un sait-il comment le faire? Trame de données: ## x1 x2 ##0 206 214 ##1 226 234 …
101 python  pandas  dataframe 

1
Façon de lire les premières lignes du dataframe pandas
Existe-t-il un moyen intégré à utiliser read_csvpour lire uniquement les premières nlignes d'un fichier sans connaître la longueur des lignes à l'avance? J'ai un gros fichier qui prend beaucoup de temps à lire, et je ne veux parfois utiliser que les 20 premières lignes, disons, pour en obtenir un échantillon …
100 python  pandas  csv  dataframe 

10
Filtrer la colonne de dataframe Pyspark avec la valeur Aucun
J'essaie de filtrer un dataframe PySpark qui a Nonecomme valeur de ligne: df.select('dt_mvmt').distinct().collect() [Row(dt_mvmt=u'2016-03-27'), Row(dt_mvmt=u'2016-03-28'), Row(dt_mvmt=u'2016-03-29'), Row(dt_mvmt=None), Row(dt_mvmt=u'2016-03-30'), Row(dt_mvmt=u'2016-03-31')] et je peux filtrer correctement avec une valeur de chaîne: df[df.dt_mvmt == '2016-03-31'] # some results here mais cela échoue: df[df.dt_mvmt == None].count() 0 df[df.dt_mvmt != None].count() 0 Mais il y …

2
Colonne binning avec pandas python
J'ai une colonne Data Frame avec des valeurs numériques: df['percentage'].head() 46.5 44.2 100.0 42.12 Je veux voir la colonne comme le nombre de bacs: bins = [0, 1, 5, 10, 25, 50, 100] Comment puis-je obtenir le résultat sous forme de bacs avec leur value counts? [0, 1] bin amount …

5
comment changer une colonne Dataframe du type String en type Double dans pyspark
J'ai un dataframe avec une colonne sous forme de chaîne. Je voulais changer le type de colonne en type Double dans PySpark. Voici le chemin que j'ai fait: toDoublefunc = UserDefinedFunction(lambda x: x,DoubleType()) changedTypedf = joindf.withColumn("label",toDoublefunc(joindf['show'])) Je voulais juste savoir, est-ce la bonne façon de le faire, car en exécutant …

6
Convertir la trame de données pandas en série
Je suis un peu nouveau pour les pandas. J'ai une trame de données pandas de 1 ligne par 23 colonnes. Je veux convertir cela en une série? Je me demande quelle est la façon la plus pythonique de faire cela? J'ai essayé pd.Series(myResults)mais ça se plaint ValueError: cannot copy sequence …







En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.