Questions marquées «dataframe»

Un bloc de données est une structure de données tabulaire. Habituellement, il contient des données où les lignes sont des observations et les colonnes sont des variables de différents types. Alors que "data frame" ou "dataframe" est le terme utilisé pour ce concept dans plusieurs langues (R, Apache Spark, deedle, Maple, la bibliothèque pandas en Python et la bibliothèque DataFrames en Julia), "table" est le terme utilisé dans MATLAB et SQL.





3
Opérateurs logiques pour l'indexation booléenne dans Pandas
Je travaille avec un index booléen dans Pandas. La question est de savoir pourquoi la déclaration: a[(a['some_column']==some_number) & (a['some_other_column']==some_other_number)] fonctionne bien alors que a[(a['some_column']==some_number) and (a['some_other_column']==some_other_number)] quitte avec une erreur? Exemple: a=pd.DataFrame({'x':[1,1],'y':[10,20]}) In: a[(a['x']==1)&(a['y']==10)] Out: x y 0 1 10 In: a[(a['x']==1) and (a['y']==10)] Out: ValueError: The truth value of …

6
Dois-je utiliser un data.frame ou une matrice?
Quand faut-il utiliser un data.frame, et quand est-il préférable d'utiliser un matrix? Les deux conservent les données dans un format rectangulaire, donc parfois ce n'est pas clair. Existe-t-il des règles générales pour savoir quand utiliser quel type de données?
152 r  matrix  dataframe  r-faq 



8
Les pandas peuvent-ils reconnaître automatiquement les dates?
Aujourd'hui, j'ai été positivement surpris par le fait qu'en lisant des données à partir d'un fichier de données (par exemple), pandas est capable de reconnaître des types de valeurs: df = pandas.read_csv('test.dat', delimiter=r"\s+", names=['col1','col2','col3']) Par exemple, il peut être vérifié de cette manière: for i, r in df.iterrows(): print type(r['col1']), …
151 python  date  types  dataframe  pandas 




11
Supprimer les colonnes du dataframe où TOUTES les valeurs sont NA
J'ai des problèmes avec une trame de données et je n'ai pas vraiment pu résoudre ce problème moi-même: la trame de données a des propriétés arbitraires sous forme de colonnes et chaque ligne représente un ensemble de données . La question est: comment se débarrasser des colonnes où pour TOUTES …
149 r  apply  dataframe 


7
Convertir les noms de lignes en première colonne
J'ai une trame de données comme celle-ci: df VALUE ABS_CALL DETECTION P-VALUE 1007_s_at "957.729231881542" "P" "0.00486279317241156" 1053_at "320.632701283368" "P" "0.0313356324173416" 117_at "429.842323161046" "P" "0.0170004527476119" 121_at "2395.7364289242" "P" "0.0114473584876183" 1255_g_at "116.493632746934" "A" "0.39799368200131" 1294_at "739.927122116896" "A" "0.0668649772942343" Je veux convertir les noms de ligne dans la première colonne. Actuellement, j'utilise quelque …
147 r  dataframe  col  rowname 

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.