Я перехожу из R в Python. Я только начал использовать Pandas. У меня есть R-код, который прекрасно подмножественно:
k1 <- subset(data, Product = p.id & Month < mn & Year == yr, select = c(Time, Product))
Теперь, я хочу делать подобные вещи в Python. это то, что я получил до сих пор:
import pandas as pd
data = pd.read_csv("../data/monthly_prod_sales.csv")
#first, index the dataset by Product. And, get all that matches a given 'p.id' and time.
data.set_index('Product')
k = data.ix[[p.id, 'Time']]
# then, index this subset with Time and do more subsetting..
Я начинаю чувствовать, что я делаю это неправильно. возможно, есть изящное решение. Может ли кто-нибудь помочь? Мне нужно извлечь месяц и год из timestamp, который у меня есть, и сделать подмножество. Возможно, есть один-лайнер, который выполнит все это:
k1 <- subset(data, Product = p.id & Time >= start_time & Time < end_time, select = c(Time, Product))
спасибо.