目录
一、datetime模块介绍
python中处理时间有个datetime模块,模块定义了如下几个类:
- datetime.date:表示日期的类,常用属性有year、month、day。
- datetime.time:表示时间的类,常用属性有hour、minute、second、microsecond。
- datetime.datetime:表示日期时间类。
- datetime.timedelta:表示时间间隔类,即两个时点之间的长度。
- datetime.tzinfo:表示时区的类。
为了大家熟悉上面常用的类,下面介绍一些实例。
1 datetime.date类
#datetime.date类 import datetime print(\'1.现在是\',datetime.date.today(),\'日\') print(\'2.现在是\',datetime.date.today().year,\'年\') print(\'3.现在是\',datetime.date.today().month,\'月\') print(\'4.现在是\',datetime.date.today().day,\'日\') #得到结果: 1.现在是 2021-10-31 日 2.现在是 2021 年 3.现在是 10 月 4.现在是 31 日
2 datetime.datetime类
#datetime.datetime类 import datetime print(\'1.现在是\',datetime.datetime.today(),\'日\') print(\'2.现在是\',datetime.datetime.today().year,\'年\') print(\'3.现在是\',datetime.datetime.today().month,\'月\') print(\'4.现在是\',datetime.datetime.today().day,\'日\') print(\'5.现在是\',datetime.datetime.today().hour,\'时\') print(\'6.现在是\',datetime.datetime.today().minute,\'分\') print(\'7.现在是\',datetime.datetime.today().second,\'秒\') print(\'8.现在是\',datetime.datetime.today().microsecond,\'微秒\') #得到结果: 1.现在是 2021-10-31 15:55:23.676360 日 2.现在是 2021 年 3.现在是 10 月 4.现在是 31 日 5.现在是 15 时 6.现在是 55 分 7.现在是 23 秒 8.现在是 677333 微秒
3 datetime.timedelta类
#datetime.timedelta类 import datetime today = datetime.date.today() yestoday = today + datetime.timedelta(days = -1) tomorrow = today + datetime.timedelta(days = 1) print(\'1.今天是\', today,\'日\') print(\'2.昨天是\', yestoday,\'日\') print(\'3.明天是\', tomorrow,\'日\') #得到结果: 1.今天是 2021-10-31 日 2.昨天是 2021-10-30 日 3.明天是 2021-11-01 日
二、日期转字符
这一小节介绍把日期转换成字符,主要用到datetime.datetime.strftime
函数。
#dateTime to str date_time_now = datetime.datetime.now() str_now1 = datetime.datetime.strftime(date_time_now, \'%Y-%m-%d\') print(date_time_now) str_now1 #得到结果: 2021-10-31 16:20:45.391792 \'2021-10-31\'
三、字符转日期
这一小节介绍把字符转换成日期,主要用到datetime.datetime.strptime
函数。
#str to date str_time = \'2021-10-21\' date_time = datetime.datetime.strptime(str_time, \'%Y-%m-%d\').date() print(date_time) #得到结果: 2021-10-21
四、数值转日期
这一小节介绍把数值转换成日期。从excel数据表中读取时间,如果是2021/10/11这种格式,会转变成相应数值44480。这时需要转换成对应的日期,具体代码如下:
#num to date from datetime import datetime from xlrd import xldate_as_datetime, xldate_as_tuple num = 44480 datetime(*xldate_as_tuple(num,0)).strftime(\'%Y-%m-%d\') #得到结果: \'2021-10-11\'
五、时间函数在催收数据处理中的应用
本小节是应用前面小节阐述的函数,处理实际工作中遇到的问题。比如有一批信贷催收数据,由于一个客户可能电话没有接通,导致存在多次拨打的可能。我们想分析客户没有还钱的真实原因,所以想取客户最后一次通话,催收员记录的客户逾期原因。这时就需要把数据集按合同号和拨打电话的时间排序,取最后一次拨打电话的逾期原因。
1 读取数据
首先是读取数据,代码如下:
import pandas as pd from xlrd import open_workbook file_name = r\'F:\\公众号\\43.时间函数\\催记-2021-10-11至2021-10-17.xlsx\' #文件名称 table = open_workbook(file_name) #打开文件 sheets_name = table.sheet_names() #获取excel中的sheet名 get_sheet1 = table.sheet_by_name(\'Sheet1\') #获取Sheet1 data = list() for i in range(get_each_sheet.nrows): col_values = get_sheet1.row_values(i, start_colx=0, end_colx=None) data.append(col_values) data1 = pd.DataFrame(data) #把Sheet1中的数据读取出来生成数据框 data1.columns = data1.iloc[0] data1 = data1.drop(index=0) #数据框列名确定,并删除第一行 data2 = data1[[\'合同号\', \'姓名\', \'联络类型\', \'联络类型\', \'催收时间\', \'催收内容\', \'催收状态\', \'委案日期\']] #取数据框中的固定列
注:如需本文数据,可直接在公众号中回复”催收数据时间处理”,即可免费获取。
得到结果:
2 把催收时间处理成日期格式
接着是处理催收时间变成日期格式,代码如下:
from datetime import datetime from xlrd import xldate_as_datetime, xldate_as_tuple def num_to_date(num_): return datetime(*xldate_as_tuple(num_,0)).strftime(\'%Y-%m-%d\') data2[\'催收时间\'] = data2[\'催收时间\'].apply(num_to_date) data2.head(2)
得到结果:
3 取客户最后一条催收记录
最后是对数据框按合同号和催收时间进行排序,取最后一条催收记录,代码如下:
data3 = data2.sort_values(by=[\'合同号\', \'催收时间\'],ascending=[False, False]) data3 = data3.groupby(\'合同号\',as_index=False).first() print(data2.shape) print(data3.shape)
得到结果:
(1744, 8)
(1455, 8)
© 版权声明
THE END
暂无评论内容