我们有一个带有日期类型列的 pandas 数据帧。利用这一列,我们可以创建以下特征:
- 年
- 年中的周
- 月
- 星期
- 周末
- 小时
- 还有更多
1 | # 添加'year'列,将 'datetime_column' 中的年份提取出来 |
有时在处理时间序列问题时,您可能需要的特征不是单个值,而是一系列值。 例如,客户在特定时间段内的交易。在这种情况下,我们会创建不同类型的特征,例如:使用数值特征时,在对分类列进行分组时,会得到类似于时间分布值列表的特征。在这种情况下,您可以创建一系列统计特征,例如
1 | import numpy as np |
时间序列数据(数值列表)可以转换成许多特征。在这种情况下,一个名为 tsfresh 的 python 库非常有用。
1 | from tsfresh.feature_extraction import feature_calculators as fc |