Это должно быть просто, но ближайшая вещь, которую я нашел, - это сообщение: pandas: заполнение отсутствующих значений внутри группы, и я все еще не могу решить свою проблему....
Предположим, что у меня есть следующий файл данных
df = pd.DataFrame({'value': [1, np.nan, np.nan, 2, 3, 1, 3, np.nan, 3], 'name': ['A','A', 'B','B','B','B', 'C','C','C']})
name value
0 A 1
1 A NaN
2 B NaN
3 B 2
4 B 3
5 B 1
6 C 3
7 C NaN
8 C 3
и я хотел бы заполнить "NaN" средним значением в каждой группе "имя", т.е.
name value
0 A 1
1 A 1
2 B 2
3 B 2
4 B 3
5 B 1
6 C 3
7 C 3
8 C 3
Я не уверен, куда идти:
grouped = df.groupby('name').mean()
Спасибо, куча.