本文来源兴业证券研报。
随着陆港通的推进,港股受到内地投资者越来越多的关注。继动量反转效应及价值维度研究后,我们推出“猎金系列二十五”,港股研究的第三篇深度报告。
我们构建17个另类因子,测试结果显示:绝大多数另类因子在港股中的选股效果相对较弱,仅过去240天日收益率峰度(RealizedKurtosis_240D)以及过去20天日均成交量/过去240天日均成交量(VolAvg_20D_240D)两个因子选股效果显著。以VolAvg_20D_240D为例,IC为0.035,T统计量4.69,多空组合年化收益17.9%,夏普率1.36,最大回撤9.1%。
另类因子在港股中失效而在A股中显著与市场结构不同有关:A股过去十多年呈现较强的小盘股效应以及非流动性溢价;而港股市值因子的选股策略波动较大,是一个风险因子;另外流动性在港股市场属于稀缺资源,长期具有流动性溢价。
我们构建13个成长因子,从测试结果来看,半年度净利润、营业利润同比增速的指标具有显著的选股能力。以营业利润同比增速为例:IC为0.032,T统计量4.09,多空组合年化收益10.0%,夏普率0.99,选股能力突出。
1、引言
相比于A股不足30年的发展历程,港股却有着近百年的历史。作为成熟市场的代表,仔细观察近20年来香港恒生综指及恒生指数的表现,不难发现其具有明显的周期性特征。每一轮涨跌的背后都有着政治、经济、社会事件的深刻背景:从本世纪初的互联网泡沫、SARS、911恐怖袭击到08年的美国次贷危机、欧债危机、再到近年的沪港通、深港通等等,都在港股市场打下了深深的烙印。
随着内地与香港金融市场彼此融合程度的不断加深,港股也受到内地投资者越来越多的关注。有鉴于此,我们兴业定量研究团队开始布局港股研究。我们将从港股基本特征谈起,逐渐过渡到量化因子筛选及有效选股策略的开发,希望为大家提供一个全方位的认知视角。
从整体市场来看,港股市场以机构投资者为主、整体呈现低估值、仙股较多、流动性较差的特征;从动量反转效应来看,港股整体呈现短期、长期反转,中期动量的特征;从价值因子的角度来看:和净利润以及现金流相关的EP_SQ、EP_TTM_Deducted、OCFP_TTM、EP_TTM指标有效性较强。在本篇报告中,我们将详细测试另类以及成长两大类因子的选股效果。本报告中所有因子的测试时间窗口为:2005年1月1日-2018年5月31日。
2、港股数据库构建及因子测试流程
资本资产定价模型(CAPM)以及套利定价模型(APT)孕育了多因子选股体系。整个多因子体系包括:Alpha模型、组合优化、风险模型,尤以Alpha模型最为重要,是多因子体系的核心和基石。Alpha因子是构成Alpha模型的基础,我们兴业定量研究团队针对A股构建了价值、成长、动量&反转、质量、分析师情绪、另类等六大类共计112个因子,在以往的报告中也分别验证了不同因子的表现。
2.1、兴业定量多因子平台简介
经过几年的积累,我们构建兴业定量多因子研究平台,完整地覆盖了A股数据的更新、因子有效性衡量、策略回测、绩效优化等功能。在日常的分析和研究之中,该平台起着非常重要的作用。对于港股,我们首先会将Wind相应的港股上市公司基本资料、行情类数据、财务类数据迁移到平台,形成完善的港股数据库,而后进一步去构建因子并进行单因子回测和策略研发。
2.2 、 因子有效性测试的方法
为了对因子的表现进行检验,我们采用Rank IC(Spearman 秩相关系数)和分位数组合测试两种方法。两种方法的逻辑参见后续图文说明(图表-3、4)。
2.2.1、C Rank IC 测试
如果一个因子对股票的预期收益具有预测作用,那么股票当期的因子值与下期股票的收益之间就会存在一定的相关性,我们可以用相关系数来刻画二者之间相关性,从而反映该因子对收益的预测效果。如果计算两者之间的 Pearson 线性相关系数,那么某些异常值可能会对结果产生很大影响。因此,在这里我们将采用更为稳健的 Spearman 秩相关系数来衡量因子的有效性。如下图所示,按照所有股票当期因子值大小进行排序,得到名次序列 A,按照所有股票下期收益大小进行排序,得到名次序列 B,计算序列 A,B 之间的相关系数,即为 Rank IC。Rank IC的绝对值越大,表明该因子对股票收益的预测能力越强。一般地,我们会统计样本区间内 Rank IC 的均值、标准差和 T-统计量,从预测能力的显著性、稳定性等多个角度分析因子的表现。
2.2.2 、分位数 组合 测试
分位数组合测试是一种较为常用的用来衡量因子有效性的方法,如图表-4 所示。首先,按照当期因子值的大小将股票分为 1-5 五个等权的分位组合,组合下期的收益分别为 R1,R2,…,R5,我们根据多空组合的收益 R1-R5 来判断因子的有效性,如果多空组合收益显著异于零则表明该因子是有效的,组合夏普比率越高,表明因子越有效。但是值得注意的是,由于分位数组合法只考虑了多空两个极端组合的收益,而忽略了中间各分位组合的相关信息,因此对因子有效性的刻画上可能存在一定的局限性。
2.2.3 、因子有效性测试的其他维度
一般而言,在做 A 股相关分析的时候,对于一个新的因子,我们会考虑该因子和市值以及行业的关系,如果因子收益有部分来自于行业或者市值,通过行业市值中性化的方式剥离其对因子的影响,取残差作为因子收益率解释变量。那么在分析其他市场的时候,我们首先需要清楚行业和市值是否对股票收益率具有一定的解释性,然后才考虑是否需要对因子做行业市值方面的中性化。
3 、另类因子测试
3.1 、 另类因子选股有效性研究
我们构建了 17 个港股另类因子,具体参见图表-5(注意,图表-5 中的方向是根据后续的 IC 测试的结果结合经济逻辑综合判断得来)。
我们通过 IC 测试以及分位数组合测试研究上述因子的选股有效性。根据 IC均值以及 T 统计量,我们发现绝大部分因子的选股效果(相应的 IC 均值在 0.03,T 统计量稳定在 3 左右)相对比较显著。
我们针对相对有效的 13 个因子进行分位数组合测试,发现结果并没有想象中的有效。大部分因子的测试结果呈现两个规律:1、各组别之间单调性较为一般;2、尽管首尾组合表现差异较大,但是多空组合测试并不理想。
我们进一步探究分位数测试和IC测试差异较大的原因,这里以RealizedVolatility_240D因子为例进行阐述。前面的测试显示:该因子的IC为0.046,t统计量为2.95,同时波动率相对较大,为20%。而观察该因子的分位数组合测试结果,可以发现虽然各组别年化收益率及夏普率单调性较好(首组年化收益率11.8%,尾组年化收益率4.3%),但是多空组合表现相对较差,年化收益率-0.6%,夏普率-0.03(具体参见图表-15)。
IC和分位数测试的差异主要源于该因子的波动性较大。实际上该因子仅在62%的月份IC为正,在2007年(金融危机前)以及2009年金融危机后的反弹期,因子IC显著为负,这意味着市场在这两个时段由偏好低波动风格切换到偏好高波动的风格,从而导致原来的低波动选股策略在相应月份的组合收益显著降低。
为什么会在这两个时间段发生风格切换呢? 2007 年香港股市处于牛市状态(参见图表 1 港股经济周期),市场风险承受能力上升,进而偏好高波动风格的选股策略。而金融危机之后(2008 年底开始),股市开始反弹,港股呈现一定的小市值特征,所以风险承受能力也有所上升,进一步偏好高波动风格的选股策略。
综合IC以及分位数组合测试结果可以发现,由于波动率较高,大多数另类因子在港股中并不是特别有效,但RealizedKurtosis_240D以及VolAvg_20D_240D两个因子依然具有较强的选股能力。
RealizedKurtosis_240D(过去240天日收益率数据计算的峰度)描述的是股票收益率的分布特征。IC测试结果显示该因子与收益率呈现负相关关系,当期因子越小未来收益越大,我们知道峰度越小意味着收益率的分布越接近正态分布,尖峰厚尾的特征越弱,因而相应股票的投机属性也就越弱。分位数组合测试也验证了该因子具有较强的选股能力,多空组合年化收益7.2%,夏普率0.70,具体参见图表-14。
VolAvg_20D_240D描述过去20天日均成交量/过去240天日均成交量,是股票成交短期放量的表征。IC测试结果显示该因子越大越好,也就意味着,如果最近20天明显放量,股价未来表现越优异。近期放量实际上意味着短期流动性增强,
反映了投资者对流动性的偏好。从分位数组合测试来看,该因子表现相当优异,各组别严格单调,多空组合年化收益率17.8%,夏普率1.36,最大回撤9.1%,具体参见图表-17。
3.2、另类因子在不同市场下的表现
在《宽客眼中的港股那些事儿系列一—市场特征以及动量因子研究》以及《宽客眼中的港股那些事儿系列二--价值因子研究》中,我们详细分析了动量因子以及价值因子在高低波动市场、牛熊市中的表现。那么针对于有效的另类因子RealizedKurtosis_240D以及VolAvg_20D_240D,我们进一步研究其在不同市场的表现差异。
在图表1“港股周期性表现”中,我们研究了恒生综指和恒生指数的周期性表现,从中可以发现恒生综合指数和恒生指数高度相关。进一步,我们将市场分成牛市和熊市,可以发现港股市场呈现明显的牛长熊短的特征,具体参见图表21。观察峰度以及放量因子在牛熊市场以及全市场的表现,我们发现RealizedKurtosis_240D因子在牛熊市场中的表现与全市场表现差异不大,而VolAvg_20D_240D在熊市中表现更加优异。VolAvg_20D_240D因子是衡量近期放量的特征因子,因子越大表示流动性越强。我们知道熊市中市场的流动性相对较差,投资者对流动性好的股票往往会给予更高的溢价,因而该因子的表现更加优异。
对比恒生综指过去20个交易日日收益率波动率与过去250个交易日日收益率波动率大小,如果前者大于后者,则定义当前市场为高波动,否则定义为低波动。基于上述对市场高低波动状态的划分,我们研究不同波动状态下的另类因子表现。
对比峰度以及放量因子在高低波动以及全市场中的表现,我们发现两个因子在高波动市场中的表现更加优异。
3.3 、 另类因子的其他维度探索
实际上针对于另类因子,我们还做了更多维度的尝试和分析,比如市值中性化的分析、行业中性化的差异性分析(包括在具体行业中的选股测试)。从结果来看:1、港股的流通市值因子是一个风险因子,对另类因子做市值中性化,没有显著提升因子表现;2、行业中性化也并没有显著提升因子表现。鉴于此,我们就不对另类因子做行业市值中性化处理。
3.4 、另类因子在 A A 股及港股中差异对比及原因分析
我们知道在 A 股中另类因子选股效果显著,以过去 20 个交易日的日均成交额为例,在 A 股中该因子 IC 为 0.107,T 统计量达到 8.4。分位数组合测试结果显示该因子各组别严格单调,且多空组合表现非常优异,年化收益率达到 30.4%,夏普率 1.62。所以,我们这里定义的另类因子在 A 股中的选股有效性远强于其在港股中的表现。
另类因子更多的是从规模、流动性、风险以及量价关系的角度去构建的,测试结果也显示该类因子在A股和港股中有显著差异。从市场结构的角度来说:过去十多年,A股呈现出非常强的小盘效应,同时A股的流动性相对较好,小盘效应和非流动性溢价造就了另类因子在A股中的有效性。
但反观港股我们会发现:1、港股并没有明显的小盘效应,前面的分析表明市值是一个风险因子;2、港股流动性相对较差。在“港股系列报告一”中,我们对比了港股日均成交金额以及换手率与A股的差异。从成交量上来看,港股的日平均成交量维持在千亿港币的水平,而A股市场目前日均成交额在4千亿人民币左右,两者相差甚远;从换手率的角度来看,港股日均换手率稳定在0.31%左右,而A股日均换手率为2.86%,A股的换手率约为港股换手率的9倍。港股的流动性远低于A股,这使得流动性在港股市场是更为稀缺的资源,市场往往会对流动性好的股票给予更高的正向溢价。
4、成长因子有效性测试
4.1、成长因子有效性测试
成长属性是多因子体系中另一类重要的风格因子,在A股中我们也论证了该类因子的有效性。针对港股,我们构造了13个成长因子(图表-31中的方向是根据后续的IC测试和背后的经济逻辑综合得到的)。
我们通过 IC 测试以及分位数组合测试研究上述因子的选股有效性,并对比行业中性化以后的表现:1、从因子角度来看:半年度的净利润同比增速、营业利润同比增速( Gr_Q_Earning、Gr_Q_OpEarning )相对有效,其他因子选股效果一般;这点与成长类因子在 A 股中的有效性规律一致;2、从行业角度来看:行业中性化以后,因子的选股有效性并没有大幅度的变动,前面有效的半年度相关指标选股能力依然非常强;同时分位数组合测试显示:行业中性化能一定程度提升Gr_Q_Earning、Gr_Q_OpEarning 因子的夏普比率 。基于此,我们后续相关研究均是用行业中性化下有效的成长因子( Gr_Q_Earning、Gr_Q_OpEarning )。
4.2.1、Gr_Q_Earning
从Gr_Q_Earning ( 半年度度净利润同比增长率 )因子表现来看,IC 均值达到0.024,T 统计量为3.41,月度IC大于0 的比例为62.50%。而从分位数组合的测试结果来看,各组在年化收益率以及夏普率方面整体满足单调性,多空组合的年化收益率为7.5%,夏普率达到0.785,最大回撤15.4%。
4.2.2、Gr_Q_OpEarning
从Gr_Q_OpEarning(半年度营业利润同比增长率)因子表现来看,IC均值达到0.029,T统计量为4.08,月度IC大于0的比例为65.80%。而从分位数组合的测试结果来看,各组在年化收益率以及夏普率方面严格单调,多空组合的年化收益率为10.0%,夏普率达到0.99,最大回撤23.7%。
总结成长类因子的表现,可以发现:1、半年度相关的指标有效性整体较高,而较长时间周期的指标有效性较低。这说明公司半年度增长利好会反映到接下来的股价当中,而较长周期的财务信息可能已经反映到早期的股价当中,对未来的股价没有预测作用;2、半年度营业利润同比增长率相对最为有效。
4.2 、 成长因子在不同市场下的表现
前面我们分析了不同市场状态(高低波动、牛熊市)下另类因子的表现,会发现另类因子在不同市场的表现会有一定的差异。这里我们进一步分析成长因子在高低波动以及牛熊市中的表现。
从测试结果来看,成长类的因子在牛市中的表现整体强于其在熊市中的表现,而在高低波动市场中差异相对较小。成长类因子反应的是公司财务方面的增长状况,当市场整体处于牛市状态的时候,经济形势向好,需求增大,有利于企业的成长和发展,因而成长类指标的选股能力也相对较强。而企业的成长属性和市场波动关联性相对较弱,因而反应成长属性的因子在高低波动状态下的表现并无显著差异。
5 、总结与展望
本文主要研究了另类因子以及成长因子在港股中的选股有效性。我们首先测试了因子本身的表现,进一步研究市值因子对另类因子的影响。整体来看,仅部分另类因子有一定的选股能力。而研究成长因子的表现,半年度的营业利润、经营活动现金流以及净利润增速选股能力突出。
截至目前,我们已经研究了动量反转效应、价值效应、另类因子、成长因子四个大的类别的因子在港股中的选股有效性。(编辑:刘瑞)