常见问题


1.什么是量化?

2.什么是因子?

因子,即指标,就是股票的某个特征,广义区分为财务类因子和技术类因子,因为在不同的市场环境,总会有发挥作用的因子。 多因子模型,即从众多因子中,选择相对有效的因子建立选股条件从而判断买入和卖出。

3.什么是单因子分析?

例如,市场普遍认为低市盈率的上市公司股票未来上涨可能性更大,则市盈率指标就为一个因子,且因子值越低越好。 类似的,如果普遍认为耐力好的运动员取得优异成绩的可能性更大,则耐力则为一个因子,且因子值越大越好。

4.什么是多因子分析?

例如,市场认为低市盈率的公司并不一定未来股价一定会上涨,还应结合其他方面如盈利能力、成长能力、运营能力等综合评价; 类似的,耐力好的运动员不一定就能取得优异成绩,还应结合其他项目综合评价,如铁人三项目运动,运动员一鼓作气赛完全程,以综合成绩来评价运动员的水平高低。

5.何谓多因子模型?

多因子模型通过寻找与股票未来收益最相关的因子作为选股标准,综合运用多因子构建模型对股票进行评价,选取综合得分高的股票,以期获得超额收益。核心部分即因子的选取和因子的综合评价,因子综合评价主要有两种方法:打分法和回归法。

6.目前多因子平台基于哪种方法?

目前多因子平台是基于打分法的逻辑,后续会进行完善加入回归法逻辑。

7.平台支持行业内选股吗?

目前平台支持的股票池有沪深300、中证500、中证800、创业板综、全部A股,后期会继续增加其他股票池,以及数库SAM一级行业分类。

8.因子数据有哪些?

目前因子数据分为财务因子(估值、盈利能力、成长能力、资本结构、运营、流动性)和技术因子(动量型、趋势型、波动型、成交量型、超买超卖型),共11类因子,后期陆续加入一致预期类因子、财务因子当季值等。

9.财务因子的LTM和YTD计算区别是什么?

10.Q1指什么?Q1收益率如何计算?

11.如何使用数库多因子平台?

参考‘帮助--多因子文档’。


走进数库多因子量化平台

多因子模型通过寻找与股票未来收益最相关的因子作为选股标准,综合运用多因子构建模型对股票进行评价,选取综合得分高的股票,以期获得超额收益。数库多因子量化平台,是数库团队依托金融大数据开发的量化平台,克服了传统策略开发过程中的种种问题,力求做到数据权威、因子丰富、回测精准、评价全面、个性化功能更加丰富。

传统策略开发过程中的问题

  1. 数据维护耗时耗力:数据量庞大,从原始数据到因子数据,任何环节出错就会造成策略失真
  2. 计算处理能力受限:个人电脑在处理批量计算时,速度缓慢
  3. 回测结果无法有效保存:无法有效的形成统一规划的可视化输出,策略结果随意保存
  4. 策略不能及时跟踪:策略更新需重复运行代码,无法有效跟踪策略绩效

数库能做到的

  1. 更高效、权威、及时的原始数据
  2. 更加全面、丰富的因子库
  3. 更加精准的回测算法
  4. 更加权威、全面的因子评价指标
  5. 更丰富的自定义功能

因子分类帮助--因子说明

财务因子 估值、盈利能力、成长能力、资本结构、运营、流动性
技术因子 动量型、趋势型、波动型、成交量型、超买超卖型
一致预期因子 敬请期待

因子数据起始时间

鉴于2007年会计准则发生重大变更,因子数据统一从2007年一季报开始提供,但由于因子的计算口径不同,因而因子的起始时间不同,举例说明如下:

因子 起始时间 说明
市净率 2007-04-30 分子为日度数据,分母为资产负债表最近报告期值,因而数据起于2007年一季报;
市盈率LTM 2008-04-30 分子为日度数据,分母为利润表最近12月值,因而数据起于2008年一季报;
利润总额_同比增长率LTM 2009-04-30 利润总额LTM为利润表最近12月值,因而其同比增长率数据起于2009年一季报;
利润总额_3年复合增长率LTM 2011-04-30 利润总额LTM为利润表最近12月值,因而其3年复合增长率数据起于2011年一季报;

因子方向

打分法,即按照所选因子方向将股票因子值排序后平均分为n组(n为所选分组数),第一组(Q1组)为超配组合,最后一组(Qn组)为低配组合,因而要设定因子方向;因子方向多为降序(因子值越大越好),少数为升序,技术类因子多为升序,因子方向不确定的因子根据历史IC及收益率表现进行确定。

因子方向 因子说明
因子升序 即因子值越小越好,如市值、估值类(市盈率、市净率、市销率等);
因子降序 即因子值越大越好,如ROE、利润、利润增长率类因子;
因子方向中性 即因子方向不确定,如周转率、资产负债率等因子;此类因子分别计算其历史IC及收益率历史表现确定其因子方向。

财务因子的计算逻辑

利润表和现金流量表数据为年初到报告期值,资产负债表数据(非平均)为最近报告期报告值,资产负债表数据(平均)为年初与最近报告期的平均值;

利润表和现金流量表数据为最近12个月值,资产负债表数据(平均)为本期值与上年同期值取平均;

财务因子数据映射说明

由于财务数据一般每季度公布一次,且通常会延迟公布(一季度与上一年四季度数据一般在今年4月底全部公布,二季度在8月底公布,三季度在10月底公布),所以将季度数据转换为更高频率数据时采用以下逻辑:

(注:此处Q为财务季度,区分后文Q1,Q5)

创建策略--多因子


标注 说明
点击创建策略项下多因子可切换到创建多因子策略界面
从左侧因子列表选择因子,并在右侧设置因子方向
参数设置
选择开始回测,并给策略命名,如三因子

1. 回测结果

点击回测结果查看策略表现

标注 说明
点击回测结果查看策略表现;
累计收益率:呈现回测期间策略与基准指数的累计收益率曲线
相关股票:呈现最后一期持仓股票所属行业、最新价

2. 分组分析

​ 分组分析,是检验策略有效性的辅助方式.优秀的多因子(打分法)策略除了收益率表现突出,还应具有分化性.而分化性是指根据因子综合打分将股票分组,各组表现要具有差异性或近似单调性,即前面组通常优于后面组.


标注 说明
点击分组分析 可切换到策略详细报告界面
分组分析由IC分析(信息系数算法)、收益率分析(收益率相关指标算法)、换手率分析(换手率算法)、月历效应、股票信息五部分组成。
选择IC分析收益率分析换手率分析月历效应股票信息,则进入相应页面,算法详见因子组合评价逻辑

IC分析

信息系数相关算法


标注 说明
基本参数设置同上,通过IC计算方法选择不同的信息系数(默认为normalIC)
图-IC : 柱状为每期的IC值,曲线为IC的12期移动均值;
图-IC分布 : 即各期IC值分布直方图,纵轴为频数
图-IC衰退 : 主要度量因子的预测能力的可持续性,与上文提到的各IC指标计算方法一样,只不过数据用的是所有股票当期的因子暴露值与滞后i期的收益率数据。首先,计算每期的因子暴露值和滞后i期的收益率间的IC信息系数,其中i=1,2,...,12;其次,分别对因子每隔i期的信息系数计算均值;
图-IC统计指标: 即各分组IC的均值、P值均值、标准差和IR值;
图-因子自相关序列:即所有股票当期因子值与滞后i期因子值的相关系数;首先,计算每期因子暴露值和之后i期的因子值的相关系数,其中,i=1,2,...,12;其次,分别对因子每隔i期的相关系数计算均值。

收益率分析

收益率相关指标算法


标注 说明
基本参数设置同上
累计收益率:即各组的累计收益率(可复选多组)和基准指数的累计收益率曲线对比,柱状为Q1-Q5的当期收益率(第一组与第五组当期收益类之差,下同)
收益率分布:呈现选择组别在所选起止时间内收益率的分布、及收益率均值和标准差
收益率对比: 呈现选择组别在所选起止时间内与基准指数的累计收益率对比,柱状为所选组相对于基准指数的超额收益
收益率评价指标:即因子收益率相关的评价性指标。

换手率分析

换手率算法


点击换手率分析可切换到换手率界面,该页面呈现如下内容;

标注 说明
基本参数设置同上
图-换手率:即所选时间段中各组的换手率序列,选择计算方法可切换不同的换手率,复选Q1-Q5可对比不同组的换手率序列;
图-平均换手率:即所选起止时间内换手率序列均值;
图-换手率对比:即对各组不同方法计算的换手率(个数法、市值权重法)序列进行对比,选择组别可切换Q1至Q5;
图-买入信号衰退和反转:
买入信号定义为因子值最高的一组,卖出信号定义为因子值最低的一组,其余定义为*中性信号
衰退 指TOP组中股票近12期仍保持买入信号的比率逐渐减少;
反转 指TOP组中股票近12期每期变更为卖出信号的比率逐渐增加;通过观察买入信号衰退和反转的速度,进而判断该因子预测能力的可持续性。(注:若无反转信号,则买入信号反转图为空。)

月历效应


金融市场与日期联系密切,有季节效应、月历效应、星期效应、假日效应等。月历效应,即因子在不同月份表现有所差异,Wachtel在1942年首次提出著名的“一月效应”,此后众多学者研究发现,大多数国家的股价指数1月份的收益率明显高于其他月份。

标注 说明
因子月历效应页面,按月份展示各年各月的收益率情况,通过横向纵向对比,可进一步研究因子的月历效应;
因子年度表现,呈现该因子各年度的信息系数、收益率、换手率等相关指标(详见算法说明)。

股票信息


股票信息,即按因子值排列选出的Q1组股票基本信息、市值分布和行业分布等,基本参数设置同上,选择组别可查看不同组别的市值和行业占比。

标注 说明
股票列表,为Q1组股票的相关信息,若股票数量较多,则只显示部分股票列表;
市值:所选组别中股票的平均市值序列
平均市值:各组各期股票平均市值的均值对比
行业占比分布:所选组别中股票的行业占比序列图
行业平均占比:所选组别中股票的各行业占比均值

3. 策略跟踪

标注 说明
选择'策略跟踪',切换到策略的模拟跟踪页面,模拟跟踪由累计收益率股票信息相关资讯三部分组成。
累计收益率:呈现回测期间Q1与基准指数的累计收益率曲线,及累计收益率(%)和最大回撤(%)指标;
股票信息:呈现当前持仓股票所属行业、因子值、最新价、昨日收盘价、涨跌幅、仓位,以及该组合的历史调仓记录等;
相关资讯:即当前持仓股票的相关新闻资讯。

Ⅱ. 高级功能--因子分析


因子列表

参数设置

参数名称 可选参数
股票池(剔除ST、*ST、停牌股票) 沪深300 、中证500、中证800 、创业板综指、全部A股
调仓期 周 、月、 季
起止时间 2007.04.30至今
分组 5组、10组、15组 、20组、30组或自定义股票数量
因子方向 升序、降序
IC计算方法 normalIC、rankIC
组合加权 平均权重、市值权重

1. 数据概览


标注 说明
选择数据概览,呈现近12期数据以及单期因子值与收益率的相关图示;
近12期所选股票池的因子值分布箱形图
近12期所选股票池的收益率分布箱形图
近12期股票覆盖率序列图(股票覆盖率:即每期被纳入到选股范围的股票占股票池所有股票的百分比)
单期因子值分布直方图
单期股票收益率和因子值散点图
单期各档收益率分布:横轴为按照所选‘因子方向’排序后划分为10组,纵轴为每组内股票收益率的分布

箱形图

又称为盒须图,如上图所示,自上而下分别为离群点(异常值)、上界(最大值)、上四分位数、均值、中位数、下四分位数、下界(最小值)。

2 . IC分析

信息系数相关算法


点击IC分析,切换到IC界面:

标注 说明
基本参数设置同上,通过IC计算方法选择不同的信息系数(默认为normalIC)
图-IC : 柱状为每期的IC值,曲线为IC的12期移动均值;
图-IC分布 : 即各期IC值分布直方图,纵轴为频数
图-IC衰退 : 主要度量因子的预测能力的可持续性,与上文提到的各IC指标计算方法一样,只不过数据用的是所有股票当期的因子暴露值与滞后i期的收益率数据。首先,计算每期的因子暴露值和滞后i期的收益率间的IC信息系数,其中i=1,2,...,12;其次,分别对因子每隔i期的信息系数计算均值;
图-IC统计指标: 即各分组IC的均值、P值均值、标准差和IR值;
图-因子自相关序列:即所有股票当期因子值与滞后i期因子值的相关系数;首先,计算每期因子暴露值和之后i期的因子值的相关系数,其中,i=1,2,...,12;其次,分别对因子每隔i期的相关系数计算均值。

3 . 收益率分析

收益率相关指标算法


标注 说明
基本参数设置同上
累计收益率:即各组的累计收益率(可复选多组)和基准指数的累计收益率曲线对比,柱状为Q1-Q5的当期收益率(第一组与第五组当期收益类之差,下同)
收益率分布:呈现选择组别在所选起止时间内收益率的分布、及收益率均值和标准差
收益率对比: 呈现选择组别在所选起止时间内与基准指数的累计收益率对比,柱状为所选组相对于基准指数的超额收益
收益率评价指标:即因子收益率相关的评价性指标。

4 .换手率分析

换手率算法


点击换手率分析可切换到换手率界面,该页面呈现如下内容;

标注 说明
图-换手率:即所选时间段中各组的换手率序列,选择计算方法可切换不同的换手率,复选Q1-Q5可对比不同组的换手率序列;
图-平均换手率:即所选起止时间内换手率序列均值;
图-换手率对比:即对各组不同方法计算的换手率(个数法、市值权重法)序列进行对比,选择组别可切换Q1至Q5;
图-买入信号衰退和反转:
买入信号定义为因子值最高的一组,卖出信号定义为因子值最低的一组,其余定义为*中性信号
衰退 指TOP组中股票近12期仍保持买入信号的比率逐渐减少;
反转 指TOP组中股票近12期每期变更为卖出信号的比率逐渐增加;通过观察买入信号衰退和反转的速度,进而判断该因子预测能力的可持续性。(注:若无反转信号,则买入信号反转图为空。)

5 . 月历效应


金融市场与日期联系密切,有季节效应、月历效应、星期效应、假日效应等。月历效应,即因子在不同月份表现有所差异,Wachtel在1942年首次提出著名的“一月效应”,此后众多学者研究发现,大多数国家的股价指数1月份的收益率明显高于其他月份。

标注 说明
因子月历效应页面,按月份展示各年各月的收益率情况,通过横向纵向对比,可进一步研究因子的月历效应;
因子年度表现,呈现该因子各年度的信息系数、收益率、换手率等相关指标(详见算法说明)。

6 . 选股结果


选股结果,即按因子值排列选出的Top组股票基本信息、市值分布和行业分布等,基本参数设置同上,选择组别可查看不同组别的市值和行业占比。

标注 说明
股票列表,为Q1组股票的相关信息,若股票数量较多,则只显示部分股票列表;
市值:所选组别中股票的平均市值序列
平均市值:各组各期股票平均市值的均值对比
行业占比分布:所选组别中股票的行业占比序列图
行业平均占比:所选组别中股票的各行业占比均值

高级功能--因子对比


选择高级功能项下的因子对比按钮,可进入因子对比界面(对比因子上限为5个);

设定相关参数后,可呈现以下内容:

标注 说明
统计指标对比表:即所选各对比因子起止时间内的信息系数、收益率、换手率等相关指标(详见算法说明);
累计收益率对比图:即所选各对比因子的累计收益率曲线对比,通过按组查看可切换至 Q1、 Q2、 Q3、 Q4、 Q5 或 Q1-Q5组;
IC对比:即所选各对比因子(不分组)信息系数序列对比,通过IC计算方法选择normal IC 或者 Rank IC;
换手率对比:即所选各对比因子所选组别的换手率序列对比,通过换手率计算方法可选择个数算法或者市值权重法;
平均市值对比:即所选各对比因子各组股票的平均市值序列对比,通过选择组别可切换至 Q1、 Q2、 Q3、 Q4、或 Q1-Q5组;
因子相关性矩阵:每两因子的相关系数,即所选起止时间内两因子滚动相关系数序列均值。
滚动相关系数:即所选N个对比因子两两因子值间的截面相关系数序列,通过选择因子设定基准因子,该图呈现N-1条滚动相关系数曲线;

IV 算法说明

单因子评价算法逻辑

因子数据获取与处理流程

MAD去极值处理

去极值算法的主要目的是为了使因子数据在一个合理的范围之内。去极值的方法主要有两种:MAD去极值法和标准差去极值法,主要区别是对极值定义不一样。

标准化处理

标准化处理使得每个报告期的所有因子的横截面数据都在一个固定范围内,处理的逻辑是用每个元素减去均值再除以标准差,主要有普通标准化和行业标准化,区别是因子暴露值的均值和标准差计算方式不同,行业标准化需要分别计算各股票所在行业的因子值的均值和标准差。

IC信息系数


IC(Information Coefficient,信息系数):

因子收益率相关指标


平均收益率

累计收益率

年化收益率

最大盈利、最小盈利

最大回撤(Drawdown)

最大回撤:在选定样本周期内任一历史时点往后推,资产价格走到最低点时的收益率回撤幅度的最大值。最大回撤用来描述买入资产后可能出现的最糟糕的情况。

标准差(年化)

波动率,即组合收益率的方差,波动率越大,则风险越高。

下行标准差(年化)

超额收益

年化超额收益

最大、最小超额收益

CAPM Alpha ,Beta

CAPM Alpha 和 Beta由因子某组收益率序列对指数同期收益率做一元线性回归得到: Alpha即每组收益相对于回测选股基准收益的Alpha值,表示风险调整后的超额收益,其中,风险用Beta衡量; Beta,即每组收益相对于回测选股基准收益的Beta值,表示该组收益相对于基准指数的波动性大小,该值大于1表示该组收益波动性大于样本,反之,则波动性小于样本;

跟踪误差(Tracking Error)

跟踪误差(年化)即超额收益的年化标准差;

胜率(Hit Ratio)

胜率即在整个样本期内,组合收益率战胜市场平均收益率的次数占整个样本期的比率 胜率越大,有效性越显著。

夏普比率(Sharp Ratio)

夏普比率,表示每承受一单位风险,会产生多少超额报酬,这里风险被定义为波动率,即组合收益的年化标准差。 夏普比率越高,每单位风险创造的超额收益越多。

信息比率(Information Ratio)

信息比率,即组合年化超额收益与跟踪误差的比值;

组合换手率计算方法


(1)个数法换手率

即每期各分组中股票数目变化百分比:

(2)权重法换手率

即各组股票权重值变化绝对值加总的一半,基于市值权重和平均权重分别得到市值加权的换手率(权重法cap)和平均加权的换手率(权重法equal):

因子组合算法逻辑


因子组合的相关评价指标与单因子分析时的指标一样,唯一的区别是因子(因子组合)暴露值不同:

相关术语

因子组合部分主要包括因子加权、计算综合因子值、综合打分、股票加权等部分,整体思路如下图:

(1)因子加权方法:

(2)综合因子值

计算综合因子值,即对有效因子原始值结合因子权重得到有效因子的赋权修正值,加总后得到个股的综合因子值;

(3)综合打分

计算综合得分,即将所有个股分别按照各单个因子修正值Value进行排序,并分为N档,第一档N分,第二档N-1分,依此类推,第N档得分为1,将个股在各因子上得分并乘以各因子的权重加总后得到个股的综合得分。

(4)股票加权

根据股票综合得分选取相应股票组合后,则要选取组合中个股的加权方法:

上述多因子组合算法通过设定因子加权方法计算股票的综合因子值、根据因子值进行打分得到股票的综合得分、根据综合得分进行分组(默认5组)得到Q1、Q2、Q3、Q4、Q5,设定股票加权方法则可参照单因子算法进行有效性评价。