У меня есть следующий пандас dataframe:
import pandas as pd
import numpy as np
d = {'age' : [21, 45, 45, 5],
'salary' : [20, 40, 10, 100]}
df = pd.DataFrame(d)
и хотел бы добавить дополнительный столбец под названием "is_rich", который фиксирует, богат ли человек в зависимости от его/ее зарплаты. Я нашел несколько способов сделать это:
# method 1
df['is_rich_method1'] = np.where(df['salary']>=50, 'yes', 'no')
# method 2
df['is_rich_method2'] = ['yes' if x >= 50 else 'no' for x in df['salary']]
# method 3
df['is_rich_method3'] = 'no'
df.loc[df['salary'] > 50,'is_rich_method3'] = 'yes'
в результате чего:
Однако я не понимаю, какой предпочтительный способ. Все ли методы одинаково хороши в зависимости от вашего приложения?