这些是我的csv文件中的一些示例行:
10/10/1949 20:30,san marcos,tx,us,cylinder,2700,45分钟,“这个事件发生在1949年至1950年初的初秋。它发生在童子军会议之后……
显然问题是 24:00 ,解决方案是 Series.str.split , date 转换为 to_datetime 和 time 通过 to_timedelta 和总结:
24:00
Series.str.split
date
to_datetime
time
to_timedelta
print (df) datetime 0 10/10/1949 20:30 1 10/10/1949 21:00 2 10/10/1955 17:00 3 10/10/1956 24:00 df[['date','time']] = df['datetime'].str.split(expand=True) df['datetime'] = (pd.to_datetime(df.pop('date'), format='%d/%m/%Y') + pd.to_timedelta(df.pop('time') + ':00')) print (df) datetime 0 1949-10-10 20:30:00 1 1949-10-10 21:00:00 2 1955-10-10 17:00:00 3 1956-10-11 00:00:00