Questions marquées «dataframe»

Un bloc de données est une structure de données tabulaire. Habituellement, il contient des données où les lignes sont des observations et les colonnes sont des variables de différents types. Alors que "data frame" ou "dataframe" est le terme utilisé pour ce concept dans plusieurs langues (R, Apache Spark, deedle, Maple, la bibliothèque pandas en Python et la bibliothèque DataFrames en Julia), "table" est le terme utilisé dans MATLAB et SQL.

8
Création d'un dataframe R ligne par ligne
Je voudrais construire un dataframe ligne par ligne dans R. J'ai fait quelques recherches, et tout ce que j'ai proposé est la suggestion de créer une liste vide, de garder un index de liste scalaire, puis à chaque fois d'ajouter à la liste une trame de données à une seule …
107 list  r  dataframe 

4
Transposer une trame de données
J'ai besoin de transposer une grande trame de données et j'ai donc utilisé: df.aree <- t(df.aree) df.aree <- as.data.frame(df.aree) Voici ce que j'obtiens: df.aree[c(1:5),c(1:5)] 10428 10760 12148 11865 name M231T3 M961T5 M960T6 M231T19 GS04.A 5.847557e+03 0.000000e+00 3.165891e+04 2.119232e+04 GS16.A 5.248690e+04 4.047780e+03 3.763850e+04 1.187454e+04 GS20.A 5.370910e+03 9.518396e+03 3.552036e+04 1.497956e+04 GS40.A 3.640794e+03 …
107 r  dataframe 

5
Obtenir le total de la colonne Pandas
Cible J'ai une trame de données Pandas, comme indiqué ci - dessous, avec plusieurs colonnes et que vous souhaitez obtenir le total de la colonne, MyColumn. Trame de données -df: print df X MyColumn Y Z 0 A 84 13.0 69.0 1 B 76 77.0 127.0 2 C 28 69.0 …
107 python  pandas  dataframe  sum 







7
Comparez deux colonnes à l'aide de pandas
En utilisant ceci comme point de départ: a = [['10', '1.2', '4.2'], ['15', '70', '0.03'], ['8', '5', '0']] df = pd.DataFrame(a, columns=['one', 'two', 'three']) Out[8]: one two three 0 10 1.2 4.2 1 15 70 0.03 2 8 5 0 Je veux utiliser quelque chose comme une ifdéclaration dans les …

5
Comment obtenir une ligne à partir de R data.frame
J'ai un data.frame avec des en-têtes de colonnes. Comment puis-je obtenir une ligne spécifique du data.frame sous forme de liste (avec les en-têtes de colonne comme clés de la liste)? Plus précisément, mon data.frame est abc 1 5 4,25 4,5 2 3,5 4 2,5 3 3,25 4 4 4 4,25 …
103 r  indexing  dataframe 

13
Comment calculer le nombre d'occurrences d'un caractère donné dans chaque ligne d'une colonne de chaînes?
J'ai un data.frame dans lequel certaines variables contiennent une chaîne de texte. Je souhaite compter le nombre d'occurrences d'un caractère donné dans chaque chaîne individuelle. Exemple: q.data<-data.frame(number=1:3, string=c("greatgreat", "magic", "not")) Je souhaite créer une nouvelle colonne pour q.data avec le nombre d'occurrences de "a" dans la chaîne (c.-à-d. C (2,1,0)). …
103 regex  r  dataframe 


9
Renvoie plusieurs colonnes de pandas apply ()
J'ai un dataframe pandas géants, df_test. Il contient une colonne «taille» qui représente la taille en octets. J'ai calculé Ko, Mo et Go à l'aide du code suivant: df_test = pd.DataFrame([ {'dir': '/Users/uname1', 'size': 994933}, {'dir': '/Users/uname2', 'size': 109338711}, ]) df_test['size_kb'] = df_test['size'].astype(int).apply(lambda x: locale.format("%.1f", x / 1024.0, grouping=True) + …

6
Créer une trame de données pandas remplie de zéro
Quelle est la meilleure façon de créer une trame de données pandas remplie de zéro d'une taille donnée? J'ai utilisé: zero_data = np.zeros(shape=(len(data),len(feature_list))) d = pd.DataFrame(zero_data, columns=feature_list) Y a-t-il une meilleure façon de le faire?
103 python  pandas  dataframe 

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.