常见问题
1.什么是量化?
- 通俗的讲,量化就是利用数据发现股票价格规律。
- 传统的投资主要基于基本面分析和技术分析,重个股轻组合,重收益轻风险;而量化是依靠数量化工具、电脑代替人脑归纳市场规律,并可以反复进行优化投资策略。
- 定性投资,类似于中医的望闻问切,多根据经验进行判断;而量化投资则如西医,多依据医学仪器拍片、化验等进行诊断;
- 定性投资运用市场经验来进行判断,量化投资区别于传统定性投资的主要特征即模型,会利用模型对市场情况进行检验和判断,进而根据检验结果进行决策。
2.什么是因子?
因子,即指标,就是股票的某个特征,广义区分为财务类因子和技术类因子,因为在不同的市场环境,总会有发挥作用的因子。 多因子模型,即从众多因子中,选择相对有效的因子建立选股条件从而判断买入和卖出。
3.什么是单因子分析?
例如,市场普遍认为低市盈率的上市公司股票未来上涨可能性更大,则市盈率指标就为一个因子,且因子值越低越好。
类似的,如果普遍认为耐力好的运动员取得优异成绩的可能性更大,则耐力则为一个因子,且因子值越大越好。
4.什么是多因子分析?
例如,市场认为低市盈率的公司并不一定未来股价一定会上涨,还应结合其他方面如盈利能力、成长能力、运营能力等综合评价; 类似的,耐力好的运动员不一定就能取得优异成绩,还应结合其他项目综合评价,如铁人三项目运动,运动员一鼓作气赛完全程,以综合成绩来评价运动员的水平高低。
5.何谓多因子模型?
多因子模型通过寻找与股票未来收益最相关的因子作为选股标准,综合运用多因子构建模型对股票进行评价,选取综合得分高的股票,以期获得超额收益。核心部分即因子的选取和因子的综合评价,因子综合评价主要有两种方法:打分法和回归法。
- 回归法,即将股票的收益率对多因子值回归,得到各因子的回归系数,将下期因子值代入回归方程,则得到股票收益率的预测值,进而根据收益率高低进行选股。回归法提高了股票对各因子的敏感性;但从计量角度考虑,回归结果易受极端值影响。
- 打分法,即根据股票的因子值结合因子加权方式得到股票的综合因子值,进而对股票进行综合打分,最终根据综合得分高低选股。打分法相对稳定,受极端值影响小。
6.目前多因子平台基于哪种方法?
目前多因子平台是基于打分法的逻辑,后续会进行完善加入回归法逻辑。
7.平台支持行业内选股吗?
目前平台支持的股票池有沪深300、中证500、中证800、创业板综、全部A股,后期会继续增加其他股票池,以及数库SAM一级行业分类。
8.因子数据有哪些?
目前因子数据分为财务因子(估值、盈利能力、成长能力、资本结构、运营、流动性)和技术因子(动量型、趋势型、波动型、成交量型、超买超卖型),共11类因子,后期陆续加入一致预期类因子、财务因子当季值等。
9.财务因子的LTM和YTD计算区别是什么?
- LTM和 YTD的区别主要在于流量型指标的取值区间不同;
- YTD逻辑:利润表和现金流量表数据为年初到报告期值,资产负债表数据(非平均)为最近报告期报告值,资产负债表数据(平均)为年初与最近报告期的平均值);
- LTM逻辑:利润表和现金流量表数据为最近12个月值,资产负债表数据(平均)为本期值与上年同期值取平均;
10.Q1指什么?Q1收益率如何计算?
- Q是分位数(quantile)的简写,Q1是指在股票池内根据因子值大小按照所选因子方向(如降序)排序,平均分为N组(默认为5组),第一组股票则为Q1,最后一组则为Q5.
- Q1收益率,即Q1组内股票的收益率,结合一定的组合内股票加权方法(等权法或市值加权法),计算得到的收益率。
- Q1-Q5即做多Q1组股票,做空Q5组股票。
11.如何使用数库多因子平台?
参考‘帮助--多因子文档’。
走进数库多因子量化平台
多因子模型通过寻找与股票未来收益最相关的因子作为选股标准,综合运用多因子构建模型对股票进行评价,选取综合得分高的股票,以期获得超额收益。数库多因子量化平台,是数库团队依托金融大数据开发的量化平台,克服了传统策略开发过程中的种种问题,力求做到数据权威、因子丰富、回测精准、评价全面、个性化功能更加丰富。
传统策略开发过程中的问题
- 数据维护耗时耗力:数据量庞大,从原始数据到因子数据,任何环节出错就会造成策略失真
- 计算处理能力受限:个人电脑在处理批量计算时,速度缓慢
- 回测结果无法有效保存:无法有效的形成统一规划的可视化输出,策略结果随意保存
- 策略不能及时跟踪:策略更新需重复运行代码,无法有效跟踪策略绩效
数库能做到的
- 更高效、权威、及时的原始数据
- 更加全面、丰富的因子库
- 更加精准的回测算法
- 更加权威、全面的因子评价指标
- 更丰富的自定义功能
因子分类【帮助--因子说明】
财务因子 | 估值、盈利能力、成长能力、资本结构、运营、流动性 |
技术因子 | 动量型、趋势型、波动型、成交量型、超买超卖型 |
一致预期因子 | 敬请期待 |
因子数据起始时间
鉴于2007年会计准则发生重大变更,因子数据统一从2007年一季报开始提供,但由于因子的计算口径不同,因而因子的起始时间不同,举例说明如下:
因子 | 起始时间 | 说明 |
---|---|---|
市净率 | 2007-04-30 | 分子为日度数据,分母为资产负债表最近报告期值,因而数据起于2007年一季报; |
市盈率LTM | 2008-04-30 | 分子为日度数据,分母为利润表最近12月值,因而数据起于2008年一季报; |
利润总额_同比增长率LTM | 2009-04-30 | 利润总额LTM为利润表最近12月值,因而其同比增长率数据起于2009年一季报; |
利润总额_3年复合增长率LTM | 2011-04-30 | 利润总额LTM为利润表最近12月值,因而其3年复合增长率数据起于2011年一季报; |
因子方向
打分法,即按照所选因子方向将股票因子值排序后平均分为n组(n为所选分组数),第一组(Q1组)为超配组合,最后一组(Qn组)为低配组合,因而要设定因子方向;因子方向多为降序(因子值越大越好),少数为升序,技术类因子多为升序,因子方向不确定的因子根据历史IC及收益率表现进行确定。
因子方向 | 因子说明 |
---|---|
因子升序 | 即因子值越小越好,如市值、估值类(市盈率、市净率、市销率等); |
因子降序 | 即因子值越大越好,如ROE、利润、利润增长率类因子; |
因子方向中性 | 即因子方向不确定,如周转率、资产负债率等因子;此类因子分别计算其历史IC及收益率历史表现确定其因子方向。 |
财务因子的计算逻辑
- YTD逻辑
利润表和现金流量表数据为年初到报告期值,资产负债表数据(非平均)为最近报告期报告值,资产负债表数据(平均)为年初与最近报告期的平均值;
- LTM逻辑
利润表和现金流量表数据为最近12个月值,资产负债表数据(平均)为本期值与上年同期值取平均;
-
YTD因子:即后缀为YTD的因子,表示该因子计算所需指标的取值逻辑为YTD
- 仅涉及利润表(或现金流量表)指标或仅涉及资产负债表指标(无需平均)时:所有指标取最近报告期值即可;
- 仅涉及利润表(或现金流量表)指标或仅涉及资产负债表指标(需平均)时:资产负债表平均指标=(期初值+最近报告期值)/2,其他指标取最近报告期值;
- 同时涉及利润表(或现金流量表)指标和资产负债表指标(无需平均)时: 资产负债表非平均指标直接取最近报告期值; 利润表或现金流量表的指标,需乘以年化调整系数进行处理,一季度年化系数为4,二季度为2,三季度为4/3,四季度为1;
- 同时涉及利润表(或现金流量表)指标和资产负债表指标(需平均)时:资产负债表平均指标=(年初值+本期期末值)/2;利润表或现金流量表的指标,需乘以年化调整系数进行处理,一季度年化系数为4,二季度为2,三季度为4/3,四季度为1.
-
LTM:后缀为LTM的因子表示该因子计算所需指标的取值逻辑为LTM
- LTM因子同时涉及利润表(或现金流量表)指标和资产负债表指标时: 利润表指标取最近12个月数值; 资产负债表指标取平均值,平均值=(本期报告值+上年同期值)/2
- LTM因子仅涉及利润表和现金流量表指标时:利润表和现金流量表指标取最近12个月数值。
财务因子数据映射说明
由于财务数据一般每季度公布一次,且通常会延迟公布(一季度与上一年四季度数据一般在今年4月底全部公布,二季度在8月底公布,三季度在10月底公布),所以将季度数据转换为更高频率数据时采用以下逻辑:
- 1、2、3月底采用上一年Q3的数据;
- 4、5、6、7月底用本年Q1的数据;
- 8、9月底用本年Q2的数据;
- 10、11、12用本年Q3的数据。
(注:此处Q为财务季度,区分后文Q1,Q5)
Ⅰ 创建策略--多因子
标注 | 说明 |
---|---|
① | 点击创建策略 项下多因子 可切换到创建多因子策略界面 |
② | 从左侧因子列表 选择因子,并在右侧设置因子方向 |
③ | 参数设置 |
④ | 选择开始回测 ,并给策略命名,如三因子 |
1. 回测结果
点击回测结果
查看策略表现
标注 | 说明 |
---|---|
① | 点击回测结果 查看策略表现; |
② | 累计收益率:呈现回测期间策略与基准指数的累计收益率曲线 |
③ | 相关股票:呈现最后一期持仓股票所属行业、最新价 |
2. 分组分析
分组分析,是检验策略有效性的辅助方式.优秀的多因子(打分法)策略除了收益率表现突出,还应具有分化性.而分化性是指根据因子综合打分将股票分组,各组表现要具有差异性或近似单调性,即前面组通常优于后面组.
标注 | 说明 |
---|---|
① | 点击分组分析 可切换到策略详细报告界面 |
② | 分组分析 由IC分析(信息系数算法)、收益率分析(收益率相关指标算法)、换手率分析(换手率算法)、月历效应、股票信息五部分组成。选择 IC分析 、收益率分析 、换手率分析 、月历效应 、股票信息 ,则进入相应页面,算法详见因子组合评价逻辑。 |
IC分析
标注 | 说明 |
---|---|
① | 基本参数设置同上,通过IC计算方法 选择不同的信息系数(默认为normalIC) |
② | 图-IC : 柱状为每期的IC值,曲线为IC的12期移动均值; |
③ | 图-IC分布 : 即各期IC值分布直方图,纵轴为频数 |
④ | 图-IC衰退 : 主要度量因子的预测能力的可持续性,与上文提到的各IC指标计算方法一样,只不过数据用的是所有股票当期的因子暴露值与滞后i期的收益率数据。首先,计算每期的因子暴露值和滞后i期的收益率间的IC信息系数,其中i=1,2,...,12;其次,分别对因子每隔i期的信息系数计算均值; |
⑤ | 图-IC统计指标: 即各分组IC的均值、P值均值、标准差和IR值; |
⑥ | 图-因子自相关序列:即所有股票当期因子值与滞后i期因子值的相关系数;首先,计算每期因子暴露值和之后i期的因子值的相关系数,其中,i=1,2,...,12;其次,分别对因子每隔i期的相关系数计算均值。 |
收益率分析
标注 | 说明 |
---|---|
① | 基本参数设置同上 |
② | 累计收益率:即各组的累计收益率(可复选多组)和基准指数的累计收益率曲线对比,柱状为Q1-Q5的当期收益率(第一组与第五组当期收益类之差,下同) |
③ | 收益率分布:呈现选择组别 在所选起止时间内收益率的分布、及收益率均值和标准差 |
④ | 收益率对比: 呈现选择组别 在所选起止时间内与基准指数的累计收益率对比,柱状为所选组相对于基准指数的超额收益 |
⑤ | 收益率评价指标:即因子收益率相关的评价性指标。 |
换手率分析
点击换手率分析
可切换到换手率界面,该页面呈现如下内容;
标注 | 说明 |
---|---|
① | 基本参数设置同上 |
② | 图-换手率:即所选时间段中各组的换手率序列,选择计算方法 可切换不同的换手率,复选Q1-Q5 可对比不同组的换手率序列; |
③ | 图-平均换手率:即所选起止时间 内换手率序列均值; |
④ | 图-换手率对比:即对各组不同方法计算的换手率(个数法、市值权重法)序列进行对比,选择组别 可切换Q1至Q5; |
⑤ | 图-买入信号衰退和反转: 买入信号定义为因子值最高的一组,卖出信号定义为因子值最低的一组,其余定义为*中性信号; 衰退 指TOP组中股票近12期仍保持买入信号的比率逐渐减少; 反转 指TOP组中股票近12期每期变更为卖出信号的比率逐渐增加;通过观察买入信号衰退和反转的速度,进而判断该因子预测能力的可持续性。(注:若无反转信号,则买入信号反转图为空。) |
月历效应
金融市场与日期联系密切,有季节效应、月历效应、星期效应、假日效应等。月历效应,即因子在不同月份表现有所差异,Wachtel在1942年首次提出著名的“一月效应”,此后众多学者研究发现,大多数国家的股价指数1月份的收益率明显高于其他月份。
标注 | 说明 |
---|---|
① | 因子月历效应页面,按月份展示各年各月的收益率情况,通过横向纵向对比,可进一步研究因子的月历效应; |
② | 因子年度表现,呈现该因子各年度的信息系数、收益率、换手率等相关指标(详见算法说明)。 |
股票信息
股票信息,即按因子值排列选出的Q1组股票基本信息、市值分布和行业分布等,基本参数设置同上,选择组别
可查看不同组别的市值和行业占比。
标注 | 说明 |
---|---|
① | 股票列表,为Q1组股票的相关信息,若股票数量较多,则只显示部分股票列表; |
② | 市值:所选组别中股票的平均市值序列 |
③ | 平均市值:各组各期股票平均市值的均值对比 |
④ | 行业占比分布:所选组别中股票的行业占比序列图 |
⑤ | 行业平均占比:所选组别中股票的各行业占比均值 |
3. 策略跟踪
标注 | 说明 |
---|---|
① | 选择'策略跟踪',切换到策略的模拟跟踪页面,模拟跟踪由累计收益率 、股票信息 、相关资讯 三部分组成。 |
② | 累计收益率:呈现回测期间Q1与基准指数的累计收益率曲线,及累计收益率(%)和最大回撤(%)指标; |
③ | 股票信息:呈现当前持仓股票所属行业、因子值、最新价、昨日收盘价、涨跌幅、仓位,以及该组合的历史调仓记录等; |
④ | 相关资讯:即当前持仓股票的相关新闻资讯。 |
Ⅱ. 高级功能--因子分析
因子列表
参数设置
参数名称 | 可选参数 |
---|---|
股票池(剔除ST、*ST、停牌股票) | 沪深300 、中证500、中证800 、创业板综指、全部A股 |
调仓期 | 周 、月、 季 |
起止时间 | 2007.04.30至今 |
分组 | 5组、10组、15组 、20组、30组或自定义股票数量 |
因子方向 | 升序、降序 |
IC计算方法 | normalIC、rankIC |
组合加权 | 平均权重、市值权重 |
1. 数据概览
标注 | 说明 |
---|---|
① | 选择数据概览 ,呈现近12期数据以及单期因子值与收益率的相关图示; |
② | 近12期所选股票池的因子值分布箱形图 |
③ | 近12期所选股票池的收益率分布箱形图 |
④ | 近12期股票覆盖率序列图(股票覆盖率:即每期被纳入到选股范围的股票占股票池所有股票的百分比) |
⑤ | 单期因子值分布直方图 |
⑥ | 单期股票收益率和因子值散点图 |
⑦ | 单期各档收益率分布:横轴为按照所选‘因子方向’排序后划分为10组,纵轴为每组内股票收益率的分布 |
箱形图
又称为盒须图,如上图所示,自上而下分别为离群点(异常值)、上界(最大值)、上四分位数、均值、中位数、下四分位数、下界(最小值)。
2 . IC分析
点击IC分析
,切换到IC界面:
标注 | 说明 |
---|---|
① | 基本参数设置同上,通过IC计算方法 选择不同的信息系数(默认为normalIC) |
② | 图-IC : 柱状为每期的IC值,曲线为IC的12期移动均值; |
③ | 图-IC分布 : 即各期IC值分布直方图,纵轴为频数 |
④ | 图-IC衰退 : 主要度量因子的预测能力的可持续性,与上文提到的各IC指标计算方法一样,只不过数据用的是所有股票当期的因子暴露值与滞后i期的收益率数据。首先,计算每期的因子暴露值和滞后i期的收益率间的IC信息系数,其中i=1,2,...,12;其次,分别对因子每隔i期的信息系数计算均值; |
⑤ | 图-IC统计指标: 即各分组IC的均值、P值均值、标准差和IR值; |
⑥ | 图-因子自相关序列:即所有股票当期因子值与滞后i期因子值的相关系数;首先,计算每期因子暴露值和之后i期的因子值的相关系数,其中,i=1,2,...,12;其次,分别对因子每隔i期的相关系数计算均值。 |
3 . 收益率分析
标注 | 说明 |
---|---|
① | 基本参数设置同上 |
② | 累计收益率:即各组的累计收益率(可复选多组)和基准指数的累计收益率曲线对比,柱状为Q1-Q5的当期收益率(第一组与第五组当期收益类之差,下同) |
③ | 收益率分布:呈现选择组别 在所选起止时间内收益率的分布、及收益率均值和标准差 |
④ | 收益率对比: 呈现选择组别 在所选起止时间内与基准指数的累计收益率对比,柱状为所选组相对于基准指数的超额收益 |
⑤ | 收益率评价指标:即因子收益率相关的评价性指标。 |
4 .换手率分析
点击换手率分析
可切换到换手率界面,该页面呈现如下内容;
标注 | 说明 |
---|---|
① | 图-换手率:即所选时间段中各组的换手率序列,选择计算方法 可切换不同的换手率,复选Q1-Q5 可对比不同组的换手率序列; |
② | 图-平均换手率:即所选起止时间 内换手率序列均值; |
③ | 图-换手率对比:即对各组不同方法计算的换手率(个数法、市值权重法)序列进行对比,选择组别 可切换Q1至Q5; |
④ | 图-买入信号衰退和反转: 买入信号定义为因子值最高的一组,卖出信号定义为因子值最低的一组,其余定义为*中性信号; 衰退 指TOP组中股票近12期仍保持买入信号的比率逐渐减少; 反转 指TOP组中股票近12期每期变更为卖出信号的比率逐渐增加;通过观察买入信号衰退和反转的速度,进而判断该因子预测能力的可持续性。(注:若无反转信号,则买入信号反转图为空。) |
5 . 月历效应
金融市场与日期联系密切,有季节效应、月历效应、星期效应、假日效应等。月历效应,即因子在不同月份表现有所差异,Wachtel在1942年首次提出著名的“一月效应”,此后众多学者研究发现,大多数国家的股价指数1月份的收益率明显高于其他月份。
标注 | 说明 |
---|---|
① | 因子月历效应页面,按月份展示各年各月的收益率情况,通过横向纵向对比,可进一步研究因子的月历效应; |
② | 因子年度表现,呈现该因子各年度的信息系数、收益率、换手率等相关指标(详见算法说明)。 |
6 . 选股结果
选股结果,即按因子值排列选出的Top组股票基本信息、市值分布和行业分布等,基本参数设置同上,选择组别
可查看不同组别的市值和行业占比。
标注 | 说明 |
---|---|
① | 股票列表,为Q1组股票的相关信息,若股票数量较多,则只显示部分股票列表; |
② | 市值:所选组别中股票的平均市值序列 |
③ | 平均市值:各组各期股票平均市值的均值对比 |
④ | 行业占比分布:所选组别中股票的行业占比序列图 |
⑤ | 行业平均占比:所选组别中股票的各行业占比均值 |
Ⅲ 高级功能--因子对比
选择高级功能
项下的因子对比
按钮,可进入因子对比界面(对比因子上限为5个);
设定相关参数后,可呈现以下内容:
标注 | 说明 |
---|---|
① | 统计指标对比表:即所选各对比因子起止时间 内的信息系数、收益率、换手率等相关指标(详见算法说明); |
② | 累计收益率对比图:即所选各对比因子的累计收益率曲线对比,通过按组查看 可切换至 Q1、 Q2、 Q3、 Q4、 Q5 或 Q1-Q5组; |
③ | IC对比:即所选各对比因子(不分组)信息系数序列对比,通过IC计算方法 选择normal IC 或者 Rank IC; |
④ | 换手率对比:即所选各对比因子所选组别 的换手率序列对比,通过换手率计算方法 可选择个数算法或者市值权重法; |
⑤ | 平均市值对比:即所选各对比因子各组股票的平均市值序列对比,通过选择组别 可切换至 Q1、 Q2、 Q3、 Q4、或 Q1-Q5组; |
⑥ | 因子相关性矩阵:每两因子的相关系数,即所选起止时间 内两因子滚动相关系数序列均值。 |
⑦ | 滚动相关系数:即所选N个对比因子两两因子值间的截面相关系数序列,通过选择因子 设定基准因子,该图呈现N-1条滚动相关系数曲线; |
IV 算法说明
单因子评价算法逻辑
因子数据获取与处理流程:
- 根据回测起始日期确定所涉及到的财报报告期;
- 根据起始日期与调仓频率确定回测期间的调仓期(具体的日期);
- 根据调仓期与财务数据映射原则确定所用到财报报告期;
- 跟据用户输入的参数从数据库中提取原始数据,原始数据有三个维度:报告期,股票名,因子值;
- 对原始数据进行去极值和标准化处理;
- 将原始数据的频率转换至用户设定的调仓周期。
MAD去极值处理
去极值算法的主要目的是为了使因子数据在一个合理的范围之内。去极值的方法主要有两种:MAD去极值法和标准差去极值法,主要区别是对极值定义不一样。
标准化处理
标准化处理使得每个报告期的所有因子的横截面数据都在一个固定范围内,处理的逻辑是用每个元素减去均值再除以标准差,主要有普通标准化和行业标准化,区别是因子暴露值的均值和标准差计算方式不同,行业标准化需要分别计算各股票所在行业的因子值的均值和标准差。
IC信息系数
IC(Information Coefficient,信息系数):
- normalIC,即某时点某因子在全部股票的暴露值与其下期回报的截面相关系数;
- rankIC,即某时点某因子在全部股票暴露值排名与其下期回报排名的截面相关系数;
因子收益率相关指标
平均收益率
累计收益率
年化收益率
最大盈利、最小盈利
最大回撤(Drawdown)
最大回撤:在选定样本周期内任一历史时点往后推,资产价格走到最低点时的收益率回撤幅度的最大值。最大回撤用来描述买入资产后可能出现的最糟糕的情况。
标准差(年化)
波动率,即组合收益率的方差,波动率越大,则风险越高。
下行标准差(年化)
超额收益
年化超额收益
最大、最小超额收益
CAPM Alpha ,Beta
CAPM Alpha 和 Beta由因子某组收益率序列对指数同期收益率做一元线性回归得到: Alpha即每组收益相对于回测选股基准收益的Alpha值,表示风险调整后的超额收益,其中,风险用Beta衡量; Beta,即每组收益相对于回测选股基准收益的Beta值,表示该组收益相对于基准指数的波动性大小,该值大于1表示该组收益波动性大于样本,反之,则波动性小于样本;
跟踪误差(Tracking Error)
跟踪误差(年化)即超额收益的年化标准差;
胜率(Hit Ratio)
胜率即在整个样本期内,组合收益率战胜市场平均收益率的次数占整个样本期的比率 胜率越大,有效性越显著。
夏普比率(Sharp Ratio)
夏普比率,表示每承受一单位风险,会产生多少超额报酬,这里风险被定义为波动率,即组合收益的年化标准差。 夏普比率越高,每单位风险创造的超额收益越多。
信息比率(Information Ratio)
信息比率,即组合年化超额收益与跟踪误差的比值;
组合换手率计算方法
(1)个数法换手率
即每期各分组中股票数目变化百分比:
(2)权重法换手率
即各组股票权重值变化绝对值加总的一半,基于市值权重和平均权重分别得到市值加权的换手率(权重法cap)和平均加权的换手率(权重法equal):
因子组合算法逻辑
因子组合的相关评价指标与单因子分析时的指标一样,唯一的区别是因子(因子组合)暴露值不同:
- 单因子分析时,股票因子暴露值就是股票当期的该因子值;
- 多因子分析时,某股票在多因子组合下的暴露值是该股票根据该因子组合内各因子加权得到的综合因子值。
相关术语
- 股票原始因子值:即股票在各因子上的暴露值;
- 股票调整因子值:即股票在各原始因子值乘以对应的因子权重所得值;
- 股票综合因子值:即股票各调整因子值的加总;
- 股票综合得分:即股票按照各原始因子值(或调整因子值)进行排序打分,股票在各因子上的得分与对应因子权重乘积的加总。
因子组合部分主要包括因子加权、计算综合因子值、综合打分、股票加权等部分,整体思路如下图:
(1)因子加权方法:
-
等权法
每个因子赋予相同的权重,即若该类别共有N个因子,则每个因子权重为1/N。
-
因子IC加权:
根据每个因子最近N个月的IC绝对值的均值进行加权,N默认为12个月。步骤如下:
- 计算回测开始期前12期至回测结束期每个因子的IC值(IC值默认为NormalIC);
- 从回测开始期至回测结束期每个因子每期的权重计算如下:
-
因子收益率加权法
根据因子最近N个月平均收益率而分配不同权重,N默认为12个月。步骤如下:
- 计算回测期开始至结束期每个因子的收益率;按照因子值排序并分组,Top组股票(平均权重)的综合收益率;
- 从回测开始期至回测结束期每个因子每期的权重计算如下:
-
因子IC_IR加权法
计算方法类似因子IC加权算法,唯一的不同是把IC替换为IC_IR,计算步骤如下:
- 计算回测开始期前12期至回测结束期每个因子的IC值(IC值默认为NormalIC);
- 从回测期开始计算每期的IC_IR值;
- 从回测开始期至回测结束期每个因子每期的权重计算如下:
(2)综合因子值
计算综合因子值,即对有效因子原始值结合因子权重得到有效因子的赋权修正值,加总后得到个股的综合因子值;
(3)综合打分
计算综合得分,即将所有个股分别按照各单个因子修正值Value进行排序,并分为N档,第一档N分,第二档N-1分,依此类推,第N档得分为1,将个股在各因子上得分并乘以各因子的权重加总后得到个股的综合得分。
(4)股票加权
根据股票综合得分选取相应股票组合后,则要选取组合中个股的加权方法:
-
【默认】平均权重法:即组合中股票具有同等的权重 ,即当组合P中包含N只股票时,每只股票的权重为1/N
-
市值权重法:组合中的股票权重取决于股票市值的大小,即根据个股最新流通市值分配不同权重.
上述多因子组合算法通过设定因子加权方法计算股票的综合因子值、根据因子值进行打分得到股票的综合得分、根据综合得分进行分组(默认5组)得到Q1、Q2、Q3、Q4、Q5,设定股票加权方法则可参照单因子算法进行有效性评价。