У меня есть большой файл csv для чтения в фрейм данных. Данные в CSV файле представлены на нескольких веб-сайтах, представляющих информацию пользователя. Например, вот структура кадра данных.
user_id, number_of_logins, number_of_images, web
001, 34, 3, aa.com
002, 4, 4, aa.com
034, 3, 3, aa.com
001, 12, 4, bb.com
002, 1, 3, bb.com
034, 2, 2, cc.com
как вы можете видеть, как только я привожу данные в кадр данных, user_id больше не является уникальным идентификатором, и это вызывает весь анализ. Я пытаюсь добавить еще несколько столбцов до user_id
, что-то вроде "generated_uid"
и в значительной степени использует индекс data.frame
для заполнения этим столбцом. Какой лучший способ это сделать.