炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!
(转自:华安证券研究)
本篇是学海拾珠系列第二百三十八篇。本文研究了最优因子择时策略的构建方法。作者发现,通过整合众多因子与预测变量来构建择时策略,可以显著提升收益。该策略的关键在于运用收缩技术,其在估计最优投资组合权重时,保留了一份对因子择时潜在收益的审慎怀疑态度。这种收缩机制能够有效防止最优择时投资组合在构建过程中被历史数据中看似诱人、实则虚假的因子择时机会误导。因此,即使面对海量的因子-预测变量组合,该方法依然能表现优异。
最优因子择时投资组合的估计方法
首先,使用Ledoit和Wolf(2003)的协方差矩阵估计量,并按照Schäfer和Strimmer(2005)的方法计算最优收缩强度。其次,使用Kozak、Nagel和Santosh(2020)收缩方法的一个变体来估计组合权重。该方法隐性地表达了对存在极高夏普比投资机会的怀疑。第三,对组合权重进行重新缩放,使得最优择时策略对原始因子的绝对权重之和在每期恰好等于1。
最优因子择时策略表现出色
本文提供了实证证据表明,在各种规模的模型中,从包含少量因子和预测变量的模型到高维模型,作者持续观察到了中等程度的因子择时收益,即使在扣除合理的交易成本之后,这种收益依然存在。
文献结论基于历史数据与海外文献进行总结;不构成任何投资建议。
1
引言
机器学习方法使得在收益预测和投资组合构建中整合大量信号变得可行。迄今为止,该领域的大部分研究都集中在横截面上,即使用公司层面的股票特征来预测股票间预期收益的差异。由此产生的投资组合代表了大量股票收益因子的静态组合。相比之下,对时间序列维度的关注则少得多。机器学习方法能否帮助结合来自大量时间序列预测变量和大量因子的信息,在高维环境下构建最优的因子择时策略?从概念上讲,如果因子收益在某种程度上不可预测,那将是令人惊讶的。那些导致横截面收益可预测性的经济力量,其强度也可能随时间而变化。例如,假设价值价差具有行为学根源,即许多投资者对价值股前景过于悲观,而对成长股过于乐观。几乎没有理由认为这种回避价值股的行为倾向(以及由此产生的价值溢价)会随时间保持恒定。同样,如果一个因子因其定价的宏观经济风险敞口而获得预期超额收益,这种补偿也不太可能是恒定的。当然,因子择时在概念上成立并不意味着在实践中是可行的。现有的因子择时研究大多集中在单一预测变量或非常少的预测变量和投资组合上,且效果不一。本文证明了当在投资组合优化框架中联合使用大量因子收益预测变量时,可以实现因子择时收益。在实证分析中,作者使用Fama和French(2015)的四因子以及Jensen、Kelly和Pedersen(2023)的更大因子集作为择时对象。本文使用宏观经济变量作为预测变量,以及因子特定的预测变量,如价值价差、动量以及其他因子多空两端的特征价差。本文在方法论上利用了这样的洞见:因子收益与滞后预测变量的叉积代表了因子择时投资组合,其中滞后预测变量驱动着因子权重的时变。遵循Brandt和Santa-Clara(2006)的思路,这将因子收益的时间序列预测问题转化为寻找这些因子择时投资组合的均值-方差最优组合的横截面问题。当预测变量或因子投资组合数量很大时,因子择时投资组合的数量会变得非常庞大。因此,必须通过多层收缩正则化来约束最优组合权重的估计,这至关重要。首先,采用Ledoit和Wolf(2003)的协方差矩阵收缩估计量。其次,估计的组合权重通过一种改编自Kozak、Nagel和Santosh(2020)的方法进行收缩。该方法与机器学习应用中常见的岭回归方法有相似之处。第三,我们专注于因子轮动策略,该策略在每一期对基础股票因子总是保持相同规模的多空头寸,只有相对分配随时间变化。这防止了策略采取具有极高隐含杠杆的极端头寸。本文建立在前期研究的基础上。Asness、Chandra、Ilmanen和Israel(2017)研究了利用每个因子的价值价差进行因子择时。他们发现择时收益甚微。与他们的结果类似,当限制预测变量仅为价值价差时,发现择时收益也非常小。然而,当将预测变量集扩展到多个因子特定预测变量和宏观经济变量并联合使用时,作者发现择时收益要大得多。Haddad、Kozak和Santosh(2020)表明,当专注于对股票因子的主成分而非单个因子本身进行择时时,基于价值价差的择时收益更大。其他论文则关注使用因子自身过去收益作为择时信号的因子动量策略。Gupta和Kelly(2019)发现股票因子存在时间序列因子动量,而Avramov等人(2017)以及Arnott、Kalesnik和Linnainmaa(2023)则发现了横截面因子动量的证据。DeMiguel、Martin-Utrera和Uppal(2024)专注于因子的波动率择时。与这些论文不同,Kagkadis等人(2024)像我们一样组合了许多预测变量,但与本文不同,他们并非旨在构建最优加权的因子择时策略。相反,他们考虑了基于因子收益预测的多种启发式因子组合方式。类似地,Neuhierl等人(2023)将大量因子与大量预测变量结合使用,通过每期按预测收益对因子进行排序来形成简单的投资组合。相比之下,将时变最优因子组合的选择嵌入到一个投资组合优化框架中。Dichtl等人(2019)也考虑了众多预测变量,但他们通过一种临时性限制对维度进行缩减,仅使用两类预测变量的第一主成分。相反,本文的方法通过数据驱动的最优收缩来适应高维度。最后,Kelly等人(2024)也使用了将收益与滞后预测变量交互的择时投资组合方法,但他们使用了预测变量的非线性变换,并且专注于对市场因子择时,而非横截面资产定价因子。
2
因子择时投资组合
作者为每个可能的预测变量-因子组合构建如公式(1)所示的因子择时投资组合。若有K个因子和J个预测变量,则会产生KJ个因子择时投资组合。作者总是将原始因子包含在因子择时投资组合中,这意味着前J个预测变量中的前K个总是设置为常数1。这些因子择时投资组合的创建,将每期对K个因子进行最优择时的时间序列问题,转化为了为KJ个因子择时投资组合选择最优恒定权重的横截面问题。从概念上讲,这现在是一个基于因子择时投资组合收益的无条件均值和协方差的标准均值-方差优化问题。例如,如果一个预测变量Xt−1与Ft强正相关,那么涉及该预测变量和因子组合的因子择时投资组合具有高期望收益,这在所有因子择时投资组合的均值-方差最优组合中可能值得赋予较高权重。通过始终给予因子择时投资组合Xt−1Ft较高的权重,最优策略就在X滞后期较高时增加对因子F的敞口。
3
因子择时最优投资组合的估计
然而,由于因子择时投资组合的数量很容易变得庞大,且对这些投资组合的期望收益和协方差的估计会受到显著的估计误差影响,这种将均值和协方差的历史估计值直接代入均值-方差最优组合权重公式的朴素方法不会产生良好的样本外表现。需要一种不同的方法来约束最优组合权重的估计。在本文的方法中,采用了三种类型的收缩,以减少估计的组合权重对估计误差的敏感性。第一种和第三种是标准的,而第二种在此因子择时应用中是新颖的。首先,使用Ledoit和Wolf(2003)的协方差矩阵估计量,确保即使有数千个因子择时投资组合,协方差矩阵也能表现良好。具体而言,采用其估计量版本,将协方差矩阵收缩至单位矩阵乘以KJ个因子择时投资组合的平均方差。按照Schäfer和Strimmer(2005)的方法计算最优收缩强度。令Σt表示基于截至t的数据得出的此收缩协方差估计量。其次,使用Kozak、Nagel和Santosh(2020)收缩方法的一个变体来估计组合权重。该方法隐性地表达了对存在极高夏普比投资机会的怀疑。之所以施加这种怀疑有利于样本外表现,是因为当此类机会在历史数据中看似明显时,这往往只是由于过去收益均值和协方差的估计误差造成的巧合。因此,该方法使组合权重偏离尝试利用这些看似“好得难以置信”的机会。正如Kozak、Nagel和Santosh(2020)所解释的,该方法与岭回归有相似之处,但其惩罚函数与标准岭回归有所不同。在对该方法的调整中,最优组合权重采用以下形式:
其中向量μt的前K个元素包含原始因子的平均收益,剩下的K(J-1)个元素包含因子-预测变量组合的平均收益。在此表达式中,Dt是一个对角矩阵,其对角线元素等于Et较低K(J-1)维的对角线元素。超参数λ控制组合权重的收缩程度。它除以Tt(可用于估计St和At的训练数据集的大小),因为当训练数据集较小、估计值易受估计误差强烈污染时,通常需要更多的收缩。在附录中,作者推导出公式(4)中的组合权重估计量,作为贝叶斯框架中的后验均值,此时先验信念表达了对因子择时能力的怀疑。这里重点解释该估计量的作用。通过考虑λ的极端值可以更好地说明这一点。如果λ=0,则完全没有收缩,公式简化为公式(3)中的朴素均值-方差最优组合权重公式。如果λ→∞,权重收敛于仅使用原始因子的朴素均值-方差最优组合。由于该组合没有赋予任何权重给那些将因子与滞后预测变量交互的因子择时投资组合,将此投资组合称为静态均值-方差最优组合。如果λ取大于零的有限值,则根据公式(4)的最优组合将赋予因子择时投资组合一定的权重,但相对于公式(3)中的朴素权重,这些权重向静态均值-方差最优组合收缩。在此意义上,λ>0的收缩在组合构建中施加了一定程度的对因子择时机会的怀疑。在下文中进一步解释如何实证地估计λ。第三,本文专注于因子轮动。也就是说,对公式(4)得出的组合权重进行重新缩放,使得最优择时策略对原始因子的绝对权重之和在每期恰好等于1。要理解如何做到这一点,请注意,当KJ个因子择时投资组合的最优权重为wt时,可以通过将wt的每个元素与相应因子择时投资组合所使用的预测变量进行叉积,来找到对原始因子的隐含权重。例如,如果wt的第10个元素是价值因子与收益率曲线斜率交互的因子择时投资组合的权重,那么将wt的第10个元素乘以收益率曲线斜率,就告诉我们最优因子择时策略在t月通过第10个因子择时投资组合赋予价值因子的权重是多少。对所有涉及因子k的因子择时投资组合,将wt的元素与相应预测变量的所有叉积求和,就得到了t月因子k的隐含权重。所有三种类型的收缩对于结果都至关重要。Ledoit-Wolf协方差矩阵收缩减轻了协方差估计误差的影响。公式(4)中的收缩方法处理了择时策略期望收益的不确定性。权重缩放到专注于因子轮动,避免了杠杆率的剧烈变化,这种变化在实际中可能不可取,并且在统计上对产生良好表现的可靠性也值得怀疑。
4
实证流程
为了实现此方法,本文需要公式(4)右边输入项的历史估计值,即因子择时投资组合收益的均值和协方差估计,并且必须找到收缩超参数λ的值。下图说明了作者的处理方式。该图的A部分展示了如何划分样本。本文使用从1965年1月到2022年12月的月度因子择时投资组合收益。要求至少有240个月的训练数据,因此首次计算组合权重是在1984年末。本文针对一系列可能的λ值进行此计算。然后,作者选择在1985年1月至1985年12月的验证期内使最优因子择时策略的夏普比率最大化的λ值。基于此λ值,计算1985年末的最优组合,并计算该组合在1986年1月至1986年12月期间的样本外表现。然后将训练数据集扩展一年。从1986年末回顾,此时有两个长度为12个月的验证数据块。第一个是上一段讨论的,它使用基于截至1984年12月的数据的权重。第二个是新的数据块,使用截至1985年12月的数据估计的权重。然后,寻找使连接起来的两个验证数据块中夏普比率最大的λ值。基于此λ值,作者获得1986年末的最优组合,并计算其在1987年1月至1987年12月的样本外表现。
然后不断重复此方法直到数据集结束。如上图的B部分所示,随着在样本中向前推进,每年都会向用于寻找最优λ的验证数据集添加一个新的验证块。我们下文报告的样本外表现统计量基于连接起来的12个月样本外数据块。
5
因子与预测变量
作者现在描述分析中使用的股票因子收益和预测变量。所有数据均为美国月度数据。在每个月底,所有预测变量都使用截至该月底的追踪标准差和均值标准化为z值。从一个小的因子集开始,以便清晰地展示方法论的工作原理。但该方法也非常适合更大规模的因子和预测变量集。
小因子集:作为小因子集,使用Fama和French(2015)五因子模型中的四个非市场因子:规模、账面市值比(B/M)、盈利能力和投资因子。下表的A部分展示了这些因子的汇总统计量。因子的标准版本使用大盘股(高于NYSE市值中位数)和小盘股(低于NYSE市值中位数)投资组合收益的平均值来构建因子的多空两端。作者还构建了这些因子的大盘股版本,其中仅使用高于NYSE市值中位数的股票来构建B/M、盈利能力和投资因子的多空两端。
大因子集:作为大因子集,使用Jensen、Kelly和Pedersen(2023)的153个因子。作者剔除了六个短期反转因子,因为本文希望避免那些换手率极高且主要交易于非流动性股票的因子。进一步剔除了16个因子,因为它们在始于1965年的样本早期年份没有数据。最后有131个因子入选。这些因子是基于每个特征的三分位构建的。每个三分位内的收益是基于截尾于NYSE80%分位点的市值进行加权。然后,每个因子的收益计算为最高三分位与最低三分位投资组合收益的价差。
宏观预测变量:下表的B部分左侧展示了宏观经济预测变量集。国债收益率、穆迪公司债券收益率和消费者价格指数通胀数据来自圣路易斯联邦储备银行的网站。实际收益率代理变量构建为一年期名义国债收益率减去12个月追踪已实现通胀。
因子特定预测变量:B部分右侧展示了因子特定的预测变量。对于每个因子,首先使用该因子的3个月收益、12个月收益以及因子日度收益的3个月波动率作为预测变量。此外,使用构建因子所用的特征(规模除外)作为预测变量。对于表中列出的Fama-French因子,这意味着使用因子的多空两端之间的B/M、盈利能力和资产增长价差作为预测变量。为了构建特征价差,特征的加权方式与构建因子多空端收益价差时的加权方式相同。对于Jensen等人的因子,首先使用与Fama-French因子相同的因子特定预测变量,但针对131个Jensen因子中的每一个进行计算。在扩展分析中,作者还研究了使用剩余的128个特征(除B/M、盈利能力和资产增长之外)作为因子特定预测变量的策略。
6
实证结果
下面展示实证结果。专注于从1986年1月到2022年12月末优化因子择时策略的样本外收益。回想一下,通过不断扩展窗口的方法每12个月更新一次用于样本外策略中组合权重的数据。择时Fama-French因子:下表的A部分第一行展示了基于Fama-French因子以及上表中列出的宏观预测变量和因子特定预测变量的最优因子择时策略的样本外表现。将因子收益与预测变量交互产生48个因子择时投资组合。作者发现,挑选这些48个投资组合估计最优组合的最优因子择时策略,实现了0.81的样本外夏普比率。
使用CRSP市值加权市场指数作为市场风险因子,作者得到了0.79的评估比率,该比率几乎与夏普比率相同。因此,最优因子择时策略的市场风险敞口非常小。作为对比,该表同时展示了简单对每个因子赋予相同恒定权重的等权重策略的夏普比率,仅为0.42,远低于最优因子择时策略的夏普比率。图表5展示了通过最大化验证期夏普比率得到的超参数λ的值。这些值在早期样本中往往较高。显然,尽管在最优权重公式(4)中λ已根据训练数据集大小(Tt)进行了缩放,但在可用数据序列较短(如样本早期)时,仍需要更高程度的收缩。
因子择时策略相对于等权重策略的夏普比率提升可能源于两个原因。第一个也是最明显的原因是,预测变量确实对因子收益具有预测能力。但第二个潜在原因也不容忽视:输入优化程序的因子择时投资组合收益的均值和协方差的扩展窗口估计值每12个月更新一次。这些更新后的估计值隐含地包含了关于原始基础因子(即Fama-French因子)收益均值和协方差估计的更新。这就引出了一个问题:相对于等权重策略,仅基于定期更新的Fama-French因子收益均值和协方差估计(而不使用预测变量)构建的均值-方差最优静态组合,究竟能带来多少夏普比率的提升?因此,图表4的A部分也报告了这种Fama-French因子静态组合的结果。为了计算这些数值,采用了与因子择时策略完全相同的流程,包括均值和协方差的扩展窗口估计、协方差矩阵的收缩估计、以及将因子权重缩放至绝对值和为1,但仅使用了原始因子本身,没有将其与滞后预测变量交互来构建因子择时投资组合。如图表4结果显示,该静态策略0.52的样本外夏普比率远低于最优因子择时策略0.81的夏普比率。尽管如此,最优静态策略相对于等权重策略确实获得了一定收益。图表6绘制了因子择时策略、静态策略和等权重策略的样本外夏普比率。该图展示了这些策略在60个月滚动窗口内的年化实现夏普比率。除了在2003年至2008年间结束的窗口期外,因子择时策略几乎在所有时间段都优于其他两个策略。重要的是,因子择时策略的优异表现在整个样本期内持续存在。事实上,在样本的最后五年(2018-2022),因子择时策略相对于静态策略和等权重策略的表现尤为突出。几乎没有理由认为择时收益随时间推移已经消失。
A部分同时展示了λ=0(即不向静态策略收缩)的结果。当投资组合数量较少时,作者获得的夏普比率与数据驱动选择最优λ值的结果大致相同。这与作者方法选择的λ值在样本末期(如图表5所示)趋近于零的观察相符。从2020年代回顾早期阶段,事后来看λ=0能带来良好表现。然而,如图表5所示,这对于1990年代的投资者而言并非事前显而易见的,因为截至当时的数据表明λ>0更优。
哪些预测变量对产生这些结果尤为重要?一种评估方法是检查在最优因子择时策略中,哪些因子择时投资组合通常获得最大(正或负)的权重。图表7展示了平均绝对权重最高的30个因子择时投资组合的平均绝对权重。柱状图的标签显示了因子与预测变量的组合。若预测变量标签不带括号,则表示其为宏观预测变量之一。对于因子特定预测变量,计算该预测变量的因子名称在括号中显示。例如,3mVol(Size)表示规模因子的三个月波动率。按绝对权重排名的前两位因子择时投资组合分别是:盈利能力因子与收益率曲线斜率的交互组合,以及规模因子与滞后三个月市场收益的交互组合。这表明收益率曲线和近期市场收益分别对预测盈利能力因子和规模因子的未来收益具有有用信息。
图表8展示了最优因子择时策略对原始四个因子的(隐含)权重。这对于评估策略的换手率非常有用。如图所示,尽管权重存在一些高频波动,但大的变动是低频的。很少出现从大幅做多急剧切换到大幅做空(或反之)的情况。然而,围绕低频变动的小幅高频变化在一年内也可能累积成可观的换手率。作者将在后文更详细地研究这一点。
图表8中权重的变化也提供了一些关于择时策略成功来源的线索。例如,关于账面市值比(B/M),因子择时策略在1999年、2007年左右以及2020年新冠疫情爆发时对价值因子采取了负向敞口。因此,它成功地避开了过去几十年价值因子的一些主要回撤。
使用众多预测变量有多重要?图表4的A部分报告了使用更受限预测变量集的几种因子择时策略变体。省略宏观变量导致夏普比率从0.81降至0.67。省略因子特定预测变量导致更大幅度的下降至0.48。因此,这两类预测变量都对因子择时策略的成功有所贡献。仅使用单一因子特定预测变量,如早期关于价值价差或动量择时的文献那样,效果不佳。仅使用B/M(即因子多空两端的价值价差)得到的夏普比率为0.49,仅略高于等权重策略的夏普比率。同样,仅使用12个月动量得到的夏普比率仅为0.49。总体而言,纳入众多预测变量提升了因子择时策略的表现。
择时Fama-French因子的大盘股版本:对标准Fama-French因子版本的一个担忧是,因子择时策略的表现可能受到Fama-French因子大量敞口的小盘股驱动。Fama-French因子的构建涉及在每个因子的多空两端分别平均一个市值加权小盘股投资组合收益和一个市值加权大盘股投资组合收益。因此,尽管采用了市值加权,但因子权重的一半在小盘股部分。为了检验择时策略在大盘股上是否同样有效,现在考察仅使用大盘股投资组合来构建每个因子多空两端的Fama-French因子大盘股版本。这些因子的大盘股版本仅使用市值高于NYSE中位数的股票。
图表4的B部分展示了这项检验的结果。夏普比率0.56远低于A部分基于标准Fama-French因子的因子择时策略的0.81。然而,使用大盘股因子时,等权重策略(0.26)和静态策略(0.30)的夏普比率也低得多。因此,对于大盘股因子,择时收益同样可观。如同A部分,最优因子择时策略的夏普比率大约是等权重策略的两倍。这一结果表明,因子择时收益并不仅限于市场中小型、流动性差、高交易成本的板块。
图表9展示了大盘股版本因子在60个月滚动窗口内的样本外夏普比率时间序列。因子择时策略相对于其他两个策略的优越性一目了然。在这些60个月窗口期内,因子择时策略几乎完全避免了任何负夏普比率的实现,而静态策略和等权重策略则未能做到。这一点在图表4B部分的绩效统计中也显而易见。因子择时策略的样本外平均收益高于静态和等权重策略,但其标准差更低,最差12个月收益仅为其他两个策略的一半左右。图表9还显示,因子择时策略的优越性在样本期的最后15年(2008-2022)尤为突出,这让人相信择时收益并非源于已不复存在的陈旧历史数据。
择时Jensen等因子(小预测变量集):现在转向Jensen、Kelly和Pedersen(2023)的因子。此时有131个因子。在对这些因子的首次分析中,使用与之前相同的预测变量集,即图表3B部分列出的那些。这产生了KJ=1,572个因子择时投资组合,将其组合进最优因子择时策略中。
图表4的C部分显示,在此情况下仍然发现了因子择时收益。最优因子择时策略1.48的夏普比率显著高于最优静态策略1.22的夏普比率。因子择时带来的收益与Fama-French因子上获得的收益非常相似。比较A、B、C三个部分,在每个案例中,因子择时相对于最优静态策略带来的夏普比率提升大约为0.30。C部分也显示最优静态策略本身相比等权重策略是一个巨大的改进。显然,在因子数量如此庞大的情况下,仅使用静态均值-方差优化的因子组合代替临时的等权重组合,就能获得显著的样本外收益。
C部分还显示,一旦投资组合数量变大,设定λ=0将不再能使策略捕捉到择时收益。没有λ>0带来的收缩作用,夏普比率会降至最优静态策略的水平。
图表10绘制了使用Jensen等因子的三种策略在60个月窗口期内的实现夏普比率时间序列。除了少数在2005年至2008年间结束的时间窗口外,最优择时策略几乎在所有时间都领先于最优静态策略。
图表11展示了平均绝对权重最高的30个因子择时投资组合的平均权重。与图表7中Fama-French因子择时投资组合相比,因子与收益率曲线变量的交互组合在图表11的高权重投资组合中更为常见。在因子特定预测变量中,盈利能力是图表11高权重投资组合中最常见的变量。
择时Jensen等因子(大预测变量集):最后,作者添加Jensen、Kelly和Pedersen(2023)因子基础的所有剩余特征的多空价差作为额外的因子特定预测变量。这将预测变量总数增至J=139,进而使因子择时投资组合数量达到KJ=18,209。对于均值-方差优化问题而言,这是一个非常庞大的资产数量。在这种高维环境下,作者方法中的收缩层对于确保良好的样本外表现至关重要。
图表4的D部分显示,在此情况下,得到最优择时策略的夏普比率为1.43。该值再次高于最优静态组合和等权重组合(它们与C部分相同,故不在D部分重复)。因此,即使在这种高维情况下,本文的方法也能成功地从预测变量中提取有用的择时信息。然而,最优静态组合和等权重组合的夏普比率与C部分(使用更少预测变量)相同。这意味着在D部分添加到预测变量集中的许多特征价差,并未提供超出C部分使用的基于B/M、资产增长、盈利能力、因子动量和波动率价差等因子特定预测变量所能捕获的有用择时信号。
不足为奇的是,对于如此庞大的投资组合集,设定λ=0效果不佳。此时夏普比率降至0.81。这说明了在高维环境下收缩的重要性。
交易成本:尽管许多预测变量变动缓慢,但集合中也包含了一些波动较大的变量,例如三个月收益或收益率变动,这增加了对基础原始因子的隐含权重的月间变化,如图表8中基于Fama-French因子的择时策略所示。尽管隐含权重很少从大幅正值急剧切换到大副负值(或反之),但围绕低频变动的小幅变化也足以产生可观的换手率。下面使用双向换手率度量进行评估:
下表展示了换手率结果。由于多空因子权重的每次变动会触发两笔交易——多头端一笔和规模相等的空头端一笔——双向年化换手率较高,即使因子上的权重并未逐月剧烈变动。基于Fama-French因子的择时策略年化双向换手率接近600%。基于大盘股版本Fama-French因子的择时策略年化换手率略高于600%。但对于Jensen等人的因子,换手率则低得多,使用小预测变量集时为250%,若使用大预测变量集则略低于此。
表的下一列显示了隐含的交易成本。这些估计基于Frazzini、Israel和Moskowitz(2018)对一家大型机构基金管理人大量实际交易的估计。他们估计单笔典型交易的成本约为10个基点(bps)。如表所示,根据这些交易成本估计,基于Fama-French因子的择时策略每年因换手产生约59个基点的绩效拖累,大盘股版本的拖累略高于此。对于Jensen等人的因子,换手率低得多,因此交易成本也低得多。表的下一列展示了根据交易成本估计调整后的择时策略夏普比率。作为对比,最后一列显示了来自图表4的扣除成本前的夏普比率。调整估计的交易成本后,夏普比率略有下降,但差异不大。即使在调整交易成本后,因子择时策略在与最优静态策略或等权重策略的比较中仍然胜出。
基于几个原因,这些交易成本估计可能是一个上限。首先,在实际投资组合中,通常存在交易多元化效应。当择时策略要求增加一个因子的权重并减少另一个因子的权重时,此再平衡所要求的个别股票交易部分会相互抵消。上述计算未考虑这一点。其次,因为基础因子需要定期再平衡,这些因子投资组合中的部分个股无论如何都会在此再平衡过程中被交易。上述计算也未考虑这一点。
该表还显示,当λ>0的收缩对扣除成本前的表现产生影响时,其对扣除交易成本后的表现影响更大。除了基于标准Fama-French因子的策略外,对于其他所有择时投资组合集,设定λ=0会导致择时投资组合的权重波动性显著增加。这种额外的权重波动性不仅损害扣除交易成本前的夏普比率;它还增加了换手率和交易成本,导致扣除成本后夏普比率更大幅度的恶化。
7
结论
股票因子择时虽具挑战,但并非不可实现。作者发现,采用一种能够将众多因子与预测变量结合以构建最优择时策略的方法,可以带来显著收益。该策略的关键部分在于一种收缩技术,它在估计最优投资组合权重时,注入了一层对因子择时潜在收益的审慎怀疑态度。这种收缩机制能够防止最优择时投资组合的构建过程被历史数据中看似诱人、实则虚妄的因子择时机会所误导。正因如此,即使面对成千上万的因子-预测变量组合,该方法依然表现优异。
在各种规模的模型中——从包含少量因子和预测变量的模型,到高维模型——作者持续观察到了中等程度的因子择时收益,即使在扣除合理的交易成本之后,这种收益依然存在。
在本文中,作者将择时投资组合的构建方法和收缩技术应用于股票市场的因子择时。然而,该方法论的适用性更为广泛。类似的技术可应用于其他领域,例如信用市场或战术性资产配置。
文献来源:
核心内容摘选自Cfa R L , Mehta M , Nagel S .于2025年3月在《Taylor & Francis》上发表的论文《Optimal Factor Timing in a High-Dimensional Setting》。
文献结论基于历史数据与海外文献进行总结;不构成任何投资建议。
本报告摘自华安证券2025年6月12日已发布的《【华安证券·金融工程】专题报告:高维环境下的最优因子择时》,具体分析内容请详见报告。若因对报告的摘编等产生歧义,应以报告发布当日的完整内容为准。