J'essaie de faire un simple nuage de points dans pyplot en utilisant un objet Pandas DataFrame, mais je veux un moyen efficace de tracer deux variables mais que les symboles soient dictés par une troisième colonne (clé). J'ai essayé différentes manières d'utiliser df.groupby, mais sans succès. Un exemple de script df est ci-dessous. Cela colore les marqueurs en fonction de «key1», mais j'aimerais voir une légende avec les catégories «key1». Suis-je proche? Merci.
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
df = pd.DataFrame(np.random.normal(10,1,30).reshape(10,3), index = pd.date_range('2010-01-01', freq = 'M', periods = 10), columns = ('one', 'two', 'three'))
df['key1'] = (4,4,4,6,6,6,8,8,8,8)
fig1 = plt.figure(1)
ax1 = fig1.add_subplot(111)
ax1.scatter(df['one'], df['two'], marker = 'o', c = df['key1'], alpha = 0.8)
plt.show()