Questions marquées «pandas»

Pandas est une bibliothèque Python pour la manipulation et l'analyse des données, par exemple les trames de données, les séries chronologiques multidimensionnelles et les jeux de données transversaux que l'on trouve couramment dans les statistiques, les résultats de la science expérimentale, l'économétrie ou la finance. Pandas est l'une des principales bibliothèques de science des données en Python.


1
Façon de lire les premières lignes du dataframe pandas
Existe-t-il un moyen intégré à utiliser read_csvpour lire uniquement les premières nlignes d'un fichier sans connaître la longueur des lignes à l'avance? J'ai un gros fichier qui prend beaucoup de temps à lire, et je ne veux parfois utiliser que les 20 premières lignes, disons, pour en obtenir un échantillon …
100 python  pandas  csv  dataframe 

6
comment filtrer les dataframes pandas par plusieurs colonnes
Pour filtrer un dataframe (df) par une seule colonne, si nous considérons les données avec des hommes et des femmes, nous pourrions: males = df[df[Gender]=='Male'] Question 1 - Mais que se passerait-il si les données s'étalaient sur plusieurs années et que je voulais voir uniquement les hommes pour 2014? Dans …
100 python  filter  pandas 

2
Colonne binning avec pandas python
J'ai une colonne Data Frame avec des valeurs numériques: df['percentage'].head() 46.5 44.2 100.0 42.12 Je veux voir la colonne comme le nombre de bacs: bins = [0, 1, 5, 10, 25, 50, 100] Comment puis-je obtenir le résultat sous forme de bacs avec leur value counts? [0, 1] bin amount …

12
Comment importer des données de mongodb vers des pandas?
J'ai une grande quantité de données dans une collection dans mongodb que je dois analyser. Comment importer ces données dans les pandas? Je suis nouveau aux pandas et aux numpy. EDIT: La collection mongodb contient des valeurs de capteur étiquetées avec la date et l'heure. Les valeurs des capteurs sont …


4
combinaisons uniques de valeurs dans les colonnes sélectionnées dans la trame de données pandas et le nombre
J'ai mes données dans la trame de données pandas comme suit: df1 = pd.DataFrame({'A':['yes','yes','yes','yes','no','no','yes','yes','yes','no'], 'B':['yes','no','no','no','yes','yes','no','yes','yes','no']}) Donc, mes données ressemblent à ceci ---------------------------- index A B 0 yes yes 1 yes no 2 yes no 3 yes no 4 no yes 5 no yes 6 yes no 7 yes yes 8 …
99 python  pandas 

12
Existe-t-il un moyen d'ajuster automatiquement les largeurs de colonne Excel avec pandas.ExcelWriter?
On me demande de générer des rapports Excel. J'utilise actuellement assez massivement des pandas pour mes données, alors j'aimerais naturellement utiliser la méthode pandas.ExcelWriter pour générer ces rapports. Cependant, les largeurs de colonne fixes posent un problème. Le code que j'ai jusqu'à présent est assez simple. Disons que j'ai un …


5
Faire appliquer Pandas DataFrame () utiliser tous les cœurs?
Depuis août 2017, Pandas DataFame.apply () est malheureusement encore limité à travailler avec un seul cœur, ce qui signifie qu'une machine multicœur perdra la majorité de son temps de calcul lorsque vous exécutez df.apply(myfunc, axis=1). Comment pouvez-vous utiliser tous vos cœurs pour exécuter Apply sur un dataframe en parallèle?
98 pandas  dask 

6
Convertir la trame de données pandas en série
Je suis un peu nouveau pour les pandas. J'ai une trame de données pandas de 1 ligne par 23 colonnes. Je veux convertir cela en une série? Je me demande quelle est la façon la plus pythonique de faire cela? J'ai essayé pd.Series(myResults)mais ça se plaint ValueError: cannot copy sequence …

13
python-pandas et bases de données comme mysql
La documentation de Pandas contient de nombreux exemples de bonnes pratiques pour travailler avec des données stockées dans différents formats. Cependant, je n'arrive pas à trouver de bons exemples pour travailler avec des bases de données comme MySQL par exemple. Quelqu'un peut-il me diriger vers des liens ou donner des …
97 python  pandas 

4
Tableau de fréquence pour une seule variable
Une dernière question pour les pandas débutants pour la journée: comment générer une table pour une seule série? Par exemple: my_series = pandas.Series([1,2,2,3,3,3]) pandas.magical_frequency_function( my_series ) >> { 1 : 1, 2 : 2, 3 : 3 } Beaucoup de recherches sur Google m'ont conduit à Series.describe () et pandas.crosstabs, …


3
Importer la colonne de dataframe pandas comme chaîne non int
Je voudrais importer le csv suivant en tant que chaînes et non en int64. Pandas read_csv le convertit automatiquement en int64, mais j'ai besoin de cette colonne sous forme de chaîne. ID 00013007854817840016671868 00013007854817840016749251 00013007854817840016754630 00013007854817840016781876 00013007854817840017028824 00013007854817840017963235 00013007854817840018860166 df = read_csv('sample.csv') df.ID >> 0 -9223372036854775808 1 -9223372036854775808 2 -9223372036854775808 …
97 python  pandas 

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.