La programmation dataframe

20

Définir la valeur d'une cellule particulière dans pandas DataFrame à l'aide d'un index

J'ai créé un Pandas DataFrame df = DataFrame(index=['A','B','C'], columns=['x','y']) et j'ai eu ça xy A NaN NaN B NaN NaN C NaN NaN Ensuite, je veux attribuer une valeur à une cellule particulière, par exemple pour la ligne «C» et la colonne «x». Je m'attendais à obtenir un tel résultat: …

479 python pandas dataframe

10

Différence entre les méthodes map, applymap et apply dans Pandas

Pouvez-vous me dire quand utiliser ces méthodes de vectorisation avec des exemples basiques? Je vois que mapc'est une Seriesméthode alors que les autres sont des DataFrameméthodes. Cependant, je me suis trompé applyet les applymapméthodes. Pourquoi avons-nous deux méthodes pour appliquer une fonction à un DataFrame? Encore une fois, des exemples …

468 python pandas dataframe vectorization

15

Convertir la trame de données pandas en tableau NumPy

Je suis intéressé à savoir comment convertir une trame de données pandas en un tableau NumPy. trame de données: import numpy as np import pandas as pd index = [1, 2, 3, 4, 5, 6, 7] a = [np.nan, np.nan, np.nan, 0.1, 0.1, 0.1, 0.1] b = [0.2, np.nan, 0.2, …

467 python arrays pandas numpy dataframe

24

Comment compter les valeurs NaN dans une colonne dans pandas DataFrame

J'ai des données, dans lesquelles je veux trouver le nombre de NaN, de sorte que si elle est inférieure à un certain seuil, je vais supprimer ces colonnes. J'ai regardé, mais je n'ai trouvé aucune fonction pour cela. il y en a value_counts, mais ce serait lent pour moi, car …

464 python pandas dataframe

5

Créer un Pandas DataFrame vide, puis le remplir?

Je commence à partir des documents pandas DataFrame ici: http://pandas.pydata.org/pandas-docs/stable/dsintro.html Je voudrais remplir le DataFrame de manière itérative avec des valeurs dans un type de calcul de série chronologique. Donc, fondamentalement, je voudrais initialiser le DataFrame avec les colonnes A, B et les lignes d'horodatage, toutes 0 ou toutes NaN. …

463 python dataframe pandas

12

Comment puis-je remplacer toutes les valeurs NaN par des zéros dans une colonne d'une trame de données pandas

J'ai une trame de données comme ci-dessous itm Date Amount 67 420 2012-09-30 00:00:00 65211 68 421 2012-09-09 00:00:00 29424 69 421 2012-09-16 00:00:00 29877 70 421 2012-09-23 00:00:00 30990 71 421 2012-09-30 00:00:00 61303 72 485 2012-09-09 00:00:00 71781 73 485 2012-09-16 00:00:00 NaN 74 485 2012-09-23 00:00:00 11072 …

458 python pandas dataframe

7

Comment convertir l'index d'une trame de données pandas en une colonne?

Cela semble assez évident, mais je n'arrive pas à comprendre comment convertir un index de trame de données en colonne? Par exemple: df= gi ptt_loc 0 384444683 593 1 384444684 594 2 384444686 596 À, df= index1 gi ptt_loc 0 0 384444683 593 1 1 384444684 594 2 2 384444686 …

456 python pandas dataframe

11

Sélectionner par chaîne partielle dans un DataFrame pandas

J'ai un DataFrameavec 4 colonnes dont 2 contiennent des valeurs de chaîne. Je me demandais s'il y avait un moyen de sélectionner des lignes sur la base d'une correspondance de chaîne partielle contre une colonne particulière? En d'autres termes, une fonction ou une fonction lambda qui ferait quelque chose comme …

451 python string pandas dataframe

9

Mélanger les lignes DataFrame

J'ai le DataFrame suivant: Col1 Col2 Col3 Type 0 1 2 3 1 1 4 5 6 1 ... 20 7 8 9 2 21 10 11 12 2 ... 45 13 14 15 3 46 16 17 18 3 ... Le DataFrame est lu à partir d'un fichier csv. …

441 python pandas dataframe permutation shuffle

7

Obtenez des statistiques pour chaque groupe (comme le nombre, la moyenne, etc.) à l'aide de pandas GroupBy?

J'ai un bloc de données dfet j'utilise plusieurs colonnes pour groupby: df['col1','col2','col3','col4'].groupby(['col1','col2']).mean() De la manière ci-dessus, j'obtiens presque la table (trame de données) dont j'ai besoin. Ce qui manque, c'est une colonne supplémentaire qui contient le nombre de lignes dans chaque groupe. En d'autres termes, je veux dire, mais j'aimerais …

439 python pandas dataframe group-by pandas-groupby

7

Comment filtrer la trame de données Pandas en utilisant 'in' et 'not in' comme dans SQL

Comment puis-je atteindre les équivalents de SQL INetNOT IN ? J'ai une liste avec les valeurs requises. Voici le scénario: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = ['UK','China'] # pseudo-code: df[df['countries'] not in countries] Ma façon actuelle de procéder est la suivante: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = pd.DataFrame({'countries':['UK','China'], 'matched':True}) # IN df.merge(countries,how='inner',on='countries') …

434 python pandas dataframe sql-function

18

UnicodeDecodeError lors de la lecture d'un fichier CSV dans Pandas avec Python

J'exécute un programme qui traite 30 000 fichiers similaires. Un nombre aléatoire d'entre eux s'arrêtent et produisent cette erreur ... File "C:\Importer\src\dfman\importer.py", line 26, in import_chr data = pd.read_csv(filepath, names=fields) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 400, in parser_f return _read(filepath_or_buffer, kwds) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 205, in _read return parser.read() File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line …

412 python pandas csv dataframe unicode

15

Importez plusieurs fichiers csv dans des pandas et concaténez dans un DataFrame

Je voudrais lire plusieurs fichiers csv d'un répertoire dans pandas et les concaténer en un grand DataFrame. Je n'ai pas pu le comprendre cependant. Voici ce que j'ai jusqu'à présent: import glob import pandas as pd # get data file names path =r'C:\DRO\DCL_rawdata_files' filenames = glob.glob(path + "/*.csv") dfs = …

404 python pandas csv dataframe concatenation

16

Modification des noms de colonne d'un bloc de données

J'ai un bloc de données appelé "nouveau prix" (voir ci-dessous) et je veux changer les noms de colonnes dans mon programme en R. > newprice Chang. Chang. Chang. 1 100 36 136 2 120 -33 87 3 150 14 164 En fait, c'est ce que je fais: names(newprice)[1]<-paste("premium") names(newprice)[2]<-paste("change") names(newprice)[3]<-paste("newprice") …

400 r dataframe rename

6

Sélection d'une ligne de séries / trames de données pandas par index entier

Je suis curieux de savoir pourquoi df[2]n'est pas pris en charge, tandis que df.ix[2]et les df[2:3]deux fonctionnent. In [26]: df.ix[2] Out[26]: A 1.027680 B 1.514210 C -1.466963 D -0.162339 Name: 2000-01-03 00:00:00 In [27]: df[2:3] Out[27]: A B C D 2000-01-03 1.02768 1.51421 -1.466963 -0.162339 Je m'attendrais df[2]à travailler de …

395 python pandas dataframe indexing

Questions marquées «dataframe»