У меня есть DataFrame со многими недостающими значениями в столбцах, которые я хочу группировать:
import pandas as pd
import numpy as np
df = pd.DataFrame({'a': ['1', '2', '3'], 'b': ['4', np.NaN, '6']})
In [4]: df.groupby('b').groups
Out[4]: {'4': [0], '6': [2]}
см., что Pandas удалил строки с целевыми значениями NaN. (Я хочу включить эти строки!)
Так как мне нужно много таких операций (многие cols имеют отсутствующие значения) и используют более сложные функции, чем просто медианные (обычно случайные леса), я хочу избежать написания слишком сложных фрагментов кода.
Любые предложения? Должен ли я писать функцию для этого или есть простое решение?