Почему мы используем 'loc' для pandas dataframes? кажется, что следующий код с использованием или без использования loc и компиляция anr запускается с симуляционной скоростью
%timeit df_user1 = df.loc[df.user_id=='5561']
100 loops, best of 3: 11.9 ms per loop
или
%timeit df_user1_noloc = df[df.user_id=='5561']
100 loops, best of 3: 12 ms per loop
Так зачем использовать loc?
Изменить: Это помечено как дублирующийся вопрос. Но хотя pandas iloc vs ix vs loc explain? упоминает, что *
вы можете выполнить поиск столбцов, просто используя фрейм данных GetItem
*
df['time'] # equivalent to df.loc[:, 'time']
он не говорит, почему мы используем loc, хотя он объясняет множество особенностей loc, мой конкретный вопрос: "Почему бы просто не опустить loc вообще"? для которого я принял очень подробный ответ ниже.
Кроме того, что другая должность ответ (который я не думаю, что это ответ) очень скрыт в обсуждении, и любой человек, ищущий то, что я искал, будет трудно найти информацию и будет намного лучше обслуживаться ответ на мой вопрос.