Questions marquées «pandas»

Pandas est une bibliothèque Python pour la manipulation et l'analyse des données, par exemple les trames de données, les séries chronologiques multidimensionnelles et les jeux de données transversaux que l'on trouve couramment dans les statistiques, les résultats de la science expérimentale, l'économétrie ou la finance. Pandas est l'une des principales bibliothèques de science des données en Python.



7
Obtenez des statistiques pour chaque groupe (comme le nombre, la moyenne, etc.) à l'aide de pandas GroupBy?
J'ai un bloc de données dfet j'utilise plusieurs colonnes pour groupby: df['col1','col2','col3','col4'].groupby(['col1','col2']).mean() De la manière ci-dessus, j'obtiens presque la table (trame de données) dont j'ai besoin. Ce qui manque, c'est une colonne supplémentaire qui contient le nombre de lignes dans chaque groupe. En d'autres termes, je veux dire, mais j'aimerais …

7
Comment filtrer la trame de données Pandas en utilisant 'in' et 'not in' comme dans SQL
Comment puis-je atteindre les équivalents de SQL INetNOT IN ? J'ai une liste avec les valeurs requises. Voici le scénario: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = ['UK','China'] # pseudo-code: df[df['countries'] not in countries] Ma façon actuelle de procéder est la suivante: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = pd.DataFrame({'countries':['UK','China'], 'matched':True}) # IN df.merge(countries,how='inner',on='countries') …

18
UnicodeDecodeError lors de la lecture d'un fichier CSV dans Pandas avec Python
J'exécute un programme qui traite 30 000 fichiers similaires. Un nombre aléatoire d'entre eux s'arrêtent et produisent cette erreur ... File "C:\Importer\src\dfman\importer.py", line 26, in import_chr data = pd.read_csv(filepath, names=fields) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 400, in parser_f return _read(filepath_or_buffer, kwds) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 205, in _read return parser.read() File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line …





15
La construction de pandas DataFrame à partir de valeurs dans des variables donne «ValueError: si vous utilisez toutes les valeurs scalaires, vous devez passer un index»
Cela peut être une question simple, mais je ne sais pas comment faire cela. Disons que j'ai deux variables comme suit. a = 2 b = 3 Je veux construire un DataFrame à partir de ceci: df2 = pd.DataFrame({'A':a,'B':b}) Cela génère une erreur: ValueError: si vous utilisez toutes les valeurs …


2
Pandas fusionnant 101
Comment effectuer un ( LEFT| RIGHT| FULL) (INNER |OUTER ) jointure avec des pandas? Comment ajouter des NaN pour les lignes manquantes après la fusion? Comment puis-je me débarrasser des NaN après la fusion? Puis-je fusionner sur l'index? Rejoignez-vous avec des pandas? Comment fusionner plusieurs DataFrames? merge? join? concat? update? …
366 python  pandas  join  merge 

2
Comment faire pivoter une trame de données
Qu'est-ce que le pivot? Comment pivoter? Est-ce un pivot? Format long à format large? J'ai vu beaucoup de questions concernant les tableaux croisés dynamiques. Même s'ils ne savent pas qu'ils demandent des tableaux croisés dynamiques, ils le sont généralement. Il est pratiquement impossible d'écrire une question canonique et une réponse …


30
Erreur de python Pandas lors de la tokenisation des données
J'essaie d'utiliser des pandas pour manipuler un fichier .csv mais j'obtiens cette erreur: pandas.parser.CParserError: Erreur lors de la tokenisation des données. Erreur C: 2 champs attendus sur la ligne 3, vu 12 J'ai essayé de lire la documentation des pandas, mais je n'ai rien trouvé. Mon code est simple: path …
343 python  csv  pandas 

En utilisant notre site, vous reconnaissez avoir lu et compris notre politique liée aux cookies et notre politique de confidentialité.
Licensed under cc by-sa 3.0 with attribution required.