Как преобразовать столбец строк DataFrame (в формате дд/мм/гггг) в datetime?
Конвертировать тип столбца DataFrame из строки в дату и время, формат дд/мм/гггг
Ответ 1
Самый простой способ - использовать to_datetime
:
df['col'] = pd.to_datetime(df['col'])
Он также предлагает аргумент dayfirst
для европейских времен (но остерегайтесь это не является строгим).
Здесь он находится в действии:
In [11]: pd.to_datetime(pd.Series(['05/23/2005']))
Out[11]:
0 2005-05-23 00:00:00
dtype: datetime64[ns]
Вы можете передать определенный формат:
In [12]: pd.to_datetime(pd.Series(['05/23/2005']), format="%m/%d/%Y")
Out[12]:
0 2005-05-23
dtype: datetime64[ns]
Ответ 2
Если столбец даты является строкой формата '2017-01-01' вы можете использовать pandas astype для преобразования его в datetime.
df['date'] = df['date'].astype('datetime64[ns]')
или используйте datetime64 [D], если вы хотите, чтобы точность дня, а не наносекунды
print(type(df_launath['date'].iloc[0]))
дает
<class 'pandas._libs.tslib.Timestamp'>
так же, как при использовании pandas.to_datetime
Вы можете попробовать его с другими форматами, тогда "% Y-% m-% d", но по крайней мере это работает.
Ответ 3
Если вы хотите указать хитрые форматы, вы можете использовать следующее:
df['date_col'] = pd.to_datetime(df['date_col'], format='%d/%m/%Y')
Подробнее о format
здесь:
Ответ 4
Если у вас есть разные форматы даты, не забудьте установить infer_datetime_format=True
, чтобы облегчить жизнь
df['date'] = pd.to_datetime(df['date'], infer_datetime_format=True)
Источник: pd.to_datetime
или если вы хотите индивидуальный подход:
def autoconvert_datetime(value):
formats = ['%m/%d/%Y', '%m-%d-%y'] # formats to try
result_format = '%d-%m-%Y' # output format
for dt_format in formats:
try:
dt_obj = datetime.strptime(value, dt_format)
return dt_obj.strftime(result_format)
except Exception as e: # throws exception when format does not match
pass
return value # let it be if it does not match
df['date'] = df['date'].apply(autoconvert_datetime)