У меня есть .csv файл контактной информации, который я импортирую как фрейм данных pandas.
>>> import pandas as pd
>>>
>>> df = pd.read_csv('data.csv')
>>> df.head()
fName lName email title
0 John Smith [email protected] CEO
1 Joe Schmo [email protected] Bagger
2 Some Person [email protected] Clerk
После импорта данных я хотел бы удалить строки, где одно поле содержит одну из нескольких подстрок в списке. Например:
to_drop = ['Clerk', 'Bagger']
for i in range(len(df)):
for k in range(len(to_drop)):
if to_drop[k] in df.title[i]:
# some code to drop the rows from the data frame
df.to_csv("results.csv")
Каков предпочтительный способ сделать это в Pandas? Должен ли этот шаг быть пост-обработкой или предпочтительнее фильтровать это до записи в фрейм данных в первую очередь? Я думал, что это будет проще манипулировать один раз в объекте фрейма данных.