Подтвердить что ты не робот

Суммирование на многоиндексном уровне в серии pandas

Используя пакет Pandas в python, я должен был бы суммировать (маргинализировать) один уровень в серии с трехуровневым мультииндексе для создания серии с двухиндийским мультииндексером. Например, если у меня есть следующее:

ind = [tuple(x) for x in ['ABC', 'ABc', 'AbC', 'Abc', 'aBC', 'aBc', 'abC', 'abc']]
mi = pd.MultiIndex.from_tuples(ind)
data = pd.Series([264, 13, 29, 8, 152, 7, 15, 1], index=mi)

A  B  C    264
      c     13
   b  C     29
      c      8
a  B  C    152
      c      7
   b  C     15
      c      1

Я хотел бы суммировать по переменной C, чтобы произвести следующий вывод:

A  B    277
   b     37
a  B    159
   b     16

Каков наилучший способ для Pandas сделать это?

4b9b3361

Ответ 1

Если вы знаете, что всегда хотите объединиться на первых двух уровнях, это довольно просто:

In [27]: data.groupby(level=[0, 1]).sum()
Out[27]:
A  B    277
   b     37
a  B    159
   b     16
dtype: int64