По конкретной задаче, скажем, у меня есть DataFrame DF
word tag count
0 a S 30
1 the S 20
2 a T 60
3 an T 5
4 the T 10
Я хочу найти для каждого "слова", "тега", который имеет наибольшее количество "счет" . Таким образом, возвращение будет чем-то вроде
word tag count
1 the S 20
2 a T 60
3 an T 5
Мне не нужен столбец count или если порядок/индекс оригинален или испорчен. Возвращение словаря { '': 'S',...} отлично.
Я надеюсь, что смогу сделать
DF.groupby(['word']).agg(lambda x: x['tag'][ x['count'].argmax() ] )
но это не сработает. Я не могу получить доступ к информации о столбцах.
Более абстрактно что функция в agg (function) видит в качестве аргумента?
btw, является .agg() тем же, что и .aggregate()?
Большое спасибо.