Supposons que j'ai un dictionnaire imbriqué 'user_dict' avec la structure:
- Niveau 1: UserId (Long Integer)
- Niveau 2: Catégorie (chaîne)
- Niveau 3: Attributs assortis (flottants, entiers, etc.)
Par exemple, une entrée de ce dictionnaire serait:
user_dict[12] = {
"Category 1": {"att_1": 1,
"att_2": "whatever"},
"Category 2": {"att_1": 23,
"att_2": "another"}}
chaque élément de user_dict
a la même structure et user_dict
contient un grand nombre d'éléments que je veux nourrir à un pandas DataFrame, en construisant la série à partir des attributs. Dans ce cas, un index hiérarchique serait utile à cette fin.
Plus précisément, ma question est de savoir s'il existe un moyen d'aider le constructeur DataFrame à comprendre que la série doit être construite à partir des valeurs du «niveau 3» dans le dictionnaire?
Si j'essaye quelque chose comme:
df = pandas.DataFrame(users_summary)
Les éléments du "niveau 1" (les UserId) sont considérés comme des colonnes, ce qui est l'opposé de ce que je veux réaliser (avoir UserId comme index).
Je sais que je pourrais construire la série après avoir parcouru les entrées du dictionnaire, mais s'il existe un moyen plus direct, ce serait très utile. Une question similaire serait de demander s'il est possible de construire un pandas DataFrame à partir d'objets json répertoriés dans un fichier.