Я ищу питоновский способ справиться со следующей проблемой.
Метод pandas.get_dummies()
отлично подходит для создания манекенов из категориального столбца кадра данных. Например, если столбец имеет значения в ['A', 'B']
, get_dummies()
создает 2 фиктивные переменные и соответственно назначает 0 или 1.
Теперь мне нужно справиться с этой ситуацией. Один столбец, позвольте назвать его "меткой", имеет значения, такие как ['A', 'B', 'C', 'D', 'A*C', 'C*D']
. get_dummies()
создает 6 манекенов, но я хочу только 4 из них, так что строка может иметь несколько 1s.
Есть ли способ справиться с этим по-питоновски? Я мог только подумать о пошаговом алгоритме, чтобы получить его, но это не будет включать get_dummies(). Благодаря
Отредактировано, надеюсь, что это более ясно!