分类因子有效性的可视化

举报
darkpard 发表于 2022/08/21 20:21:42 2022/08/21
【摘要】 上上个周末,我们发布了《“多头排列”年化收益率206419.51%!??》和《这才是“多头排列”可能的年化收益率》,那么哪些因素会影响“多头排列”的收益呢?我们以买入日期为例,说明因子对于区分持有1天收益率的影响。trade_data2 = trade_data1[['buy_date', 'r1']]trade_data2 = trade_data2.dropna(how='any')tr...

上上个周末,我们发布了《“多头排列”年化收益率206419.51%!??》和《这才是“多头排列”可能的年化收益率》,那么哪些因素会影响“多头排列”的收益呢?

我们以买入日期为例,说明因子对于区分持有1天收益率的影响。

trade_data2 = trade_data1[['buy_date', 'r1']]
trade_data2 = trade_data2.dropna(how='any')

trade_data1见这才是“多头排列”可能的年化收益率》。

图片

trade_data2.describe()

图片

把buy_date分成4组

for i in trade_data2.index:    
    if trade_data2['buy_date'][i] < 20201105:
        trade_data2['buy_date_type'][i] = 'very early'
    elif trade_data2['buy_date'][i] < 20210605:
        trade_data2['buy_date_type'][i] = 'early'
    elif trade_data2['buy_date'][i] < 20211235:
        trade_data2['buy_date_type'][i] = 'late'
    else:
        trade_data2['buy_date_type'][i] = 'very late'trade_data2

图片


接下来我们通过几个图形来直观地感受下各组之间的区别。


1. 箱线图

import seaborn as sns
import matplotlib.pyplot as plt
sns.boxplot(data=trade_data2, x='buy_date_type', y='r1')
plt.title('boxplot')

图片

可以看到,单从箱体来看,这4组几乎没有区别,但从须线可以看到,它们之间还是有些区别的。


2. 直方图

sns.histplot(data=trade_data2, x='r1', hue='buy_date_type', stat='density', common_norm=False)
plt.legend(['very early', 'early', 'late', 'very late'], labelcolor='red')
plt.title("Density Histogram")

图片

可惜这个图在当前情况下并不直观,也许只有两组数据时会更加直观一些。


3. 核密度图

sns.kdeplot(x='r1', data=trade_data2, hue='buy_date_type', common_norm=False)
plt.legend(['very early', 'early', 'late', 'very late'], labelcolor='red')
plt.title("Kernel Density Function")

图片

这个图还是比较直观的,可以清楚地看出late组的集中度最高,very late组的集中度最低;但只能勉强地看出very early组均值最小,early组均值最大。


4. 累积分布图

sns.histplot(x='r1', data=trade_data2, hue='buy_date_type', bins=len(trade_data2), stat="density",element="step", fill=False, cumulative=True, common_norm=False)
plt.legend(['very early', 'early', 'late', 'very late'], labelcolor='red')
plt.title("Cumulative distribution function")

图片

这个图的效果也不是很明显,只能勉强看出late组的效果好于very late组。

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。