Questions marquées «pandas»

Pandas est une bibliothèque Python pour la manipulation et l'analyse des données, par exemple les trames de données, les séries chronologiques multidimensionnelles et les jeux de données transversaux que l'on trouve couramment dans les statistiques, les résultats de la science expérimentale, l'économétrie ou la finance. Pandas est l'une des principales bibliothèques de science des données en Python.

6
Les pandas iterrows ont-ils des problèmes de performances?
J'ai remarqué de très mauvaises performances lors de l'utilisation d'iterrows de pandas. Est-ce quelque chose que les autres vivent? Est-ce spécifique à iterrows et cette fonction doit-elle être évitée pour les données d'une certaine taille (je travaille avec 2-3 millions de lignes)? Cette discussion sur GitHub m'a amené à croire …


6
Convertir la série Pandas en DataFrame
J'ai une série Pandas sf: email email1@email.com [1.0, 0.0, 0.0] email2@email.com [2.0, 0.0, 0.0] email3@email.com [1.0, 0.0, 0.0] email4@email.com [4.0, 0.0, 0.0] email5@email.com [1.0, 0.0, 3.0] email6@email.com [1.0, 5.0, 0.0] Et je voudrais le transformer en DataFrame suivant: index | email | list _____________________________________________ 0 | email1@email.com | [1.0, 0.0, …

11
Diviser le dataframe en plusieurs dataframes
J'ai un très grand dataframe (environ 1 million de lignes) avec des données d'une expérience (60 répondants). Je souhaite diviser le dataframe en 60 dataframes (un dataframe pour chaque participant). Dans la trame de données, datail existe une variable appelée 'name', qui est le code unique de chaque participant. J'ai …

2
Groupe de pandas par plage de valeurs
Existe-t-il une méthode simple dans les pandas pour appeler groupbysur une plage d'incréments de valeurs? Par exemple, étant donné l'exemple ci-dessous, puis-je classer et regrouper la colonne Bavec un 0.155incrément de sorte que, par exemple, le premier couple de groupes de la colonne Bsoit divisé en plages comprises entre '0 …



4
Chargement d'un fichier avec plus d'une ligne de JSON dans Pandas
J'essaie de lire un fichier JSON dans un cadre de données Python pandas (0.14.0). Voici la première ligne du fichier JSON: {"votes": {"funny": 0, "useful": 0, "cool": 0}, "user_id": "P_Mk0ygOilLJo4_WEvabAA", "review_id": "OeT5kgUOe3vcN7H6ImVmZQ", "stars": 3, "date": "2005-08-26", "text": "This is a pretty typical cafe. The sandwiches and wraps are good but …

4
Concaténer les chaînes de plusieurs lignes à l'aide de Pandas groupby
Je souhaite fusionner plusieurs chaînes dans un dataframe basé sur un groupedby dans Pandas. C'est mon code pour l'instant: import pandas as pd from io import StringIO data = StringIO(""" "name1","hej","2014-11-01" "name1","du","2014-11-02" "name1","aj","2014-12-01" "name1","oj","2014-12-02" "name2","fin","2014-11-01" "name2","katt","2014-11-02" "name2","mycket","2014-12-01" "name2","lite","2014-12-01" """) # load string as stream into dataframe df = pd.read_csv(data,header=0, names=["name","text","date"],parse_dates=[2]) …

6
DataFrame volumineux et persistant dans les pandas
J'explore le passage à python et aux pandas en tant qu'utilisateur SAS de longue date. Cependant, lors de l'exécution de certains tests aujourd'hui, j'ai été surpris que python soit à court de mémoire lors de la tentative d' pandas.read_csv()un fichier csv de 128 Mo. Il contenait environ 200 000 lignes …
91 python  pandas  sas 


9
Importer un fichier CSV en tant que DataFrame pandas
Quelle est la façon Python de lire un fichier CSV dans un DataFrame pandas (que je peux ensuite utiliser pour des opérations statistiques, peut avoir des colonnes de types différents, etc.)? Mon fichier CSV "value.txt"a le contenu suivant: Date,"price","factor_1","factor_2" 2012-06-11,1600.20,1.255,1.548 2012-06-12,1610.02,1.258,1.554 2012-06-13,1618.07,1.249,1.552 2012-06-14,1624.40,1.253,1.556 2012-06-15,1626.15,1.258,1.552 2012-06-16,1626.15,1.263,1.558 2012-06-17,1626.15,1.264,1.572 Dans R, nous lirions …
91 python  pandas  csv  dataframe 

6
sélection de pandas multi-index
J'ai une trame de données multi-index avec les colonnes «A» et «B». Existe-t-il un moyen de sélectionner des lignes en filtrant sur une colonne du multi-index sans réinitialiser l'index à un seul index de colonne? Par exemple. # has multi-index (A,B) df #can I do this? I know this doesn't …

2
Lire un fichier délimité par des tabulations avec Pandas - fonctionne sous Windows, mais pas sur Mac
J'ai lu un fichier de données délimité par des tabulations dans Windows avec Pandas / Python sans aucun problème. Le fichier de données contient des notes dans les trois premières lignes, puis suit avec un en-tête. df = pd.read_csv(myfile,sep='\t',skiprows=(0,1,2),header=(0)) J'essaye maintenant de lire ce fichier avec mon Mac. (Ma première …


En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.