Скажем, у меня есть dataframe в Pandas, как показано ниже:
> my_dataframe
col1 col2
A foo
B bar
C something
A foo
A bar
B foo
где строки представляют экземпляры и функции ввода столбцов (не отображая метку-мишень, но это было бы для задачи классификации), т.е. я пытаюсь построить X из my_dataframe
.
Как можно эффективно векторизовать это с помощью, например, DictVectorizer
?
Нужно ли сначала конвертировать каждую запись в моем DataFrame в словарь? (так, как это делается в примере в ссылке выше). Есть ли более эффективный способ сделать это?