SQL как объединение в pandas - программирование

У меня есть два фрейма данных, первый имеет вид (обратите внимание, что даты являются объектами datetime):

df = DataFrame('key': [0,1,2,3,4,5],
               'date': [date0,date1, date2, date3, date4, date5],
               'value': [0,10,20,30,40,50])

И вторая, которая имеет вид:

df2 = DataFrame('key': [0,1,2,3,4,5],
                'valid_from': [date0, date0, date0, date3, date3, date3],
                'valid_to': [date2, date2, date2, date5, date5, date5],
                'value': [0, 100, 200, 300, 400, 500])

И я пытаюсь эффективно объединиться, где совпадают ключи, а дата находится между действительными_from и valid_to. Я придумал следующее:

def map_keys(df2, key, date):
    value = df2[df2['key'] == key & 
        df2['valid_from'] <= date & 
        df2['valid_to'] >= date]['value'].values[0]
    return value

keys = df['key'].values
dates = df['date'].values
keys_dates = zip(keys, dates)

values = []
for key_date in keys_dates:
    value = map_keys(df2, key_date[0], key_date[1])
    values.append(value)

df['joined_value'] = values

В то время как это, похоже, делает работу, это не похоже на особенно элегантное решение. Мне было интересно, есть ли у кого-нибудь лучшее предложение для такого объединения.

Спасибо, что помогли - это очень ценно.

n = 8 dates = pd.date_range('1/1/2013', freq='D', periods=n) df = DataFrame({'key': np.arange(n), 'date': dates, 'value': np.arange(n) * 10}) df2 = DataFrame({'key': np.arange(n), 'valid_from': dates[[1,1,1,1,5,5,5,5]], 'valid_to': dates[[4,4,4,4,6,6,6,6]], 'value': np.arange(n) * 100})

key valid_from valid_to value 0 0 2013-01-02 00:00:00 2013-01-05 00:00:00 0 1 1 2013-01-02 00:00:00 2013-01-05 00:00:00 100 2 2 2013-01-02 00:00:00 2013-01-05 00:00:00 200 3 3 2013-01-02 00:00:00 2013-01-05 00:00:00 300 4 4 2013-01-06 00:00:00 2013-01-07 00:00:00 400 5 5 2013-01-06 00:00:00 2013-01-07 00:00:00 500 6 6 2013-01-06 00:00:00 2013-01-07 00:00:00 600 7 7 2013-01-06 00:00:00 2013-01-07 00:00:00 700

date key value_x valid_from valid_to value_y 0 2013-01-01 00:00:00 0 0 2013-01-02 00:00:00 2013-01-05 00:00:00 0 1 2013-01-02 00:00:00 1 10 2013-01-02 00:00:00 2013-01-05 00:00:00 100 2 2013-01-03 00:00:00 2 20 2013-01-02 00:00:00 2013-01-05 00:00:00 200 3 2013-01-04 00:00:00 3 30 2013-01-02 00:00:00 2013-01-05 00:00:00 300 4 2013-01-05 00:00:00 4 40 2013-01-06 00:00:00 2013-01-07 00:00:00 400 5 2013-01-06 00:00:00 5 50 2013-01-06 00:00:00 2013-01-07 00:00:00 500 6 2013-01-07 00:00:00 6 60 2013-01-06 00:00:00 2013-01-07 00:00:00 600 7 2013-01-08 00:00:00 7 70 2013-01-06 00:00:00 2013-01-07 00:00:00 700

date key value joined_value 0 2013-01-01 00:00:00 0 0 NaN 1 2013-01-02 00:00:00 1 10 100 2 2013-01-03 00:00:00 2 20 200 3 2013-01-04 00:00:00 3 30 300 4 2013-01-05 00:00:00 4 40 NaN 5 2013-01-06 00:00:00 5 50 500 6 2013-01-07 00:00:00 6 60 600 7 2013-01-08 00:00:00 7 70 NaN

Ответ 1