Группировка pandas данных по двум столбцам (или более)?

У меня есть следующий фреймворк:

mydf = pandas.DataFrame({"cat": ["first", "first", "first", "second", "second", "third"], "class": ["A", "A", "A", "B", "B", "C"], "name": ["a1", "a2", "a3", "b1", "b2", "c1"], "val": [1,5,1,1,2,10]})

Я хочу создать dataframe, который делает сводную статистику о столбце val элементов с тем же идентификатором class. Для этого я использую groupby следующим образом:

mydf.groupby("class").val.sum()

что правильное поведение, но я хотел бы сохранить информацию столбца cat в полученном df. это можно сделать? мне нужно merge/join эту информацию позже? Я пробовал:

mydf.groupby(["cat", "class"]).val.sum()

но это использует иерархическую индексацию. Я хотел бы иметь простой фреймворк, который имеет только значение cat для каждой группы, где группа class. Выходом должен быть dataframe (не серия) со значениями cat и class, где записи val суммируются по каждой записи, которая имеет тот же class:

cat     class    val
first   A         7
second  B         3
third   C        10

Это возможно?

Группировка pandas данных по двум столбцам (или более)?

Ответ 1

ИЗМЕНИТЬ