Я занят работой над проектом с регрессией k-ближайшего соседа. У меня смешанные числовые и категориальные поля. Категориальные значения являются порядковыми (например, имя банка, тип учетной записи). Численные типы, например. заработной платы и возраста. Существуют также некоторые двоичные типы (например, мужчины, женщины).
Как мне включить включение категориальных значений в анализ KNN?
Насколько мне известно, нельзя просто сопоставить каждое категориальное поле с цифровыми клавишами (например, банк 1 = 1, банк 2 = 2 и т.д.), поэтому мне нужен лучший подход для использования категориальных полей. Я слышал, что можно использовать двоичные числа - это приемлемый метод? Совет будет очень признателен.