У меня есть DataFrame
который выглядит следующим образом:
userID, category, frequency
1,cat1,1
1,cat2,3
1,cat9,5
2,cat4,6
2,cat9,2
2,cat10,1
3,cat1,5
3,cat7,16
3,cat8,2
Количество различных категорий равно 10, и я хотел бы создать вектор объектов для каждого userID
и заполнить недостающие категории нулями.
Таким образом, результат будет примерно таким:
userID,feature
1,[1,3,0,0,0,0,0,0,5,0]
2,[0,0,0,6,0,0,0,0,2,1]
3,[5,0,0,0,0,0,16,2,0,0]
Это просто иллюстративный пример, в действительности у меня есть около 200 000 уникальных идентификаторов пользователей и 300 уникальных категорий.
Каков наиболее эффективный способ создания функций DataFrame
?