20160812-东方证券-《因子选股系列研究之十》:ALPHA因子库精简与优化
一、研究结论
国内量化发展已有十余年,各家机构投资者的 Alpha 因子库也随之扩大,这
时会面临两个问题:alpha 信息源的重叠与因子间相关性处理。本报告将提
供这两个问题的解决处理方法,
我们基于 Fama-MacBeth 回归设计了一套 Alpha 因子筛选流程,剔除信息重
复的因子。在实证中,我们把 11 个 Alpha 因子筛选至 5 个,筛选过程几乎
没有 alpha 信息的损失,筛选前后的多因子多空组合表现相当。因子筛选可
以显著减少因子数量,继而减少需要估计的模型参数数量,提高估计量的准
确性,从而提升模型选股表现。
Alpha 优化采用的是 Qian(2007)的方法,这个方法有点类似股票组合优化,
alpha 因子充当了个股的角色。该方法可以很好的处理因子相关性问题,实
际运用的关键在于因子 IC 协方差矩阵的估计。传统样本协方差矩阵的估计
方差太大,效果不佳,本报告中采用 Ledoit(2003)提出的压缩估计量方法
和 Bootstrap 方法来提升估计量准确性,alpha 模型选股效果得到显著改善。
为便于叙述,本报告中采用的是 alpha 因子原始数据和原始收益率来计算 IC,
并未做风险中性化处理,但报告中的方法对风险中性的情况也适用,风险中
性后可以获得更稳健的多空组合。
二、从我们和机构投资者的交流情况来看,目前市场上做 Alpha 模型有两种方向:一种是“精英
型”,即寻找 IC 高、IR 稳定、表现优秀的“精英”因子,用少量的这些因子来构建组合;另一种
则是
“群众型”,即建造一个大型 Alpha 因子库,单个 Alpha 因子可能表现不是非常出众,但是
它能贡献独立的 Alpha 信息源,有助于稳定收益。
两种方向对比而言,个人更偏向后者,因为这更符合分散风险的量化投资基本原理,但是大型
Alpha 因子库在提供多样 Alpha 源的同时,也带来大量无效和重复信息,若信息汇总处理不当,会
使得不同 Alpha 源被人为的放大或缩小权重,最终影响组合表现。另外,面对一个大型 Alpha 因
子库,投资者在找到一个新的 Alpha 因子时,有必要思考这个因子是否提供了新的 Alpha 源或只
是把现有 Alpha 因子库的因子信息进行了切分重组。
三、定价理论
(略)
有了定价理论,继而将因子分为以下四类:
1) Alpha 因子,这种因子的风险溢价均值的绝对值很大,方差很小,说明用这个因子来做选股
可以获得显著而且稳定的超额收益。
2) 风险因子,风险因子的风险溢价均值的绝对值很小,甚至接近于零,用这个因子来做选股长期
来看没有明显超额收益;但同时,由于它是一个显著定价因子,说明它对股价有影响;由于风
险溢价的方差很大,因此在构建组合时,应该尽量剔除此类因子的影响来获得稳定收益。
3) Alpha 因子&风险因子. 这类因子的风险溢价均值很大,说明它的选股能力很强,但同时它的
风险溢价方差很大,说明它的风险也很高,兼具 Alpha 因子和风险因子的特征。A 股市场上最
明显的例子是市值因子,从 09 年以来的历史表现来看,把市值因子归为 alpha 因子合理可行,
但是它的风险溢价波动也非常之大,例如 14 年 12 月小盘股跑输大盘股近 30%,但 15 年 5
月小盘股相对大盘股的超额收益超过 60%。拿这类因子做 alpha 还是风险因子,取决于投资
者自己的选择;我们目前的研究里面把市值当作风险因子,这个决定更多的是基于对未来的考
量。过去几年小盘股溢价的几个重要贡献因素,如:小盘成长股稀缺性、壳效应、大资金的操
盘,未来可能随着注册制的推行、市场监管的趋严而失效,我们预防的是未来风格切换风险。
4) 低效因子。此类因子的风险溢价均值和方差都很小,在投资中实用价值不大。
四、因子筛选与 Alpha 优化
1、因子筛选流程(参看研报)
2 Alpha 优化
经过因子筛选,剔除不能贡献独立 alpha 来源的因子后,下一步是要给各个 alpha 因子赋予权
重,把单个 alpha 因子的 zscore 加总成一个 zscore。传统方法是做等权处理,但这显然忽视了 alpha
因子之间的相关性,使得因子的权重被人为的放缩。一种改进的方法是复合因子方法,先把同一类
别的因子合成一个因子(例如:把 PE、PB 合成一个估值因子),再把这些复合因子进行等权加
总,这样做可以降低但不能消除因子间相关性的影响,而且在合成复合因子过程中,基本面因子的
逻辑比较清晰,比较好归类,但技术面因子的逻辑差别较大,很难分类;如果强行把所有技术面因
子归为一类的话,会降低技术面因子的权重,而 A 股目前的现状是技术面因子表现整体强于基本
面因子,因此这样做会降低模型表现。

- 报告十.png (164.79 KiB) 查看 6376 次
后续的略了,可以看原来的报告