(来源:建榕量化研究)
A股市场中,股票日内分钟成交量在时间维度,总体呈现“头尾高,中间低”的“U”型分布特征。日内分钟成交量一方面体现了分钟交易活跃度;另一方面,日内分钟成交量的局域分布特征,体现了日内不同时点,各类投资者的交易参与度。本报告中,我们对日内分钟成交量做全方位解析,通过日内分钟成交量的局域分布特征,将个股日内分钟成交量划分为“峰、岭、谷”三种状态,从而挖掘不同状态下的alpha信息。
第一节,我们详细介绍对成交量“峰、岭、谷”三类状态的划分方法。第二节至第六节,报告分别从分钟数、分钟收益、相对加权价格、加权价格分位点以及时间间隔统计特征方面,对“峰、岭、谷”各类别独立构建相应因子。第七节,我们将不同类别之间相互结合,分别从加权价格比值、成交额比值、成交额跟随比例、成交额敏感度、成交额相关性以及同时点统计数相关性方面,构建有效因子。考虑到报告涉及因子数量较多,将部分数据在第八节进行补充,讨论了本报告因子与Barra风格因子的相关性、本报告因子间的相关性以及因子的分域表现。
01
日内成交量状态划分:峰、岭、谷
本报告中,我们对个股日内分钟成交量状态进行划分,先按成交量水平将分钟成交量划分为喷发成交量与温和成交量,考虑到个股日内成交量受交易时段影响较大,总体呈现“U”型分布特征,我们对过去20日同时点成交量按照1倍标准差的标准划分,高于1倍标准差划为喷发成交量,低于1倍标准差划为温和成交量。然后,我们对喷发成交量进一步按照连续与否划分。若当前分钟为喷发成交量,且前后1分钟均为温和成交量,则划为孤立喷发成交量;若当前分钟为喷发成交量,且前后1分钟存在喷发成交量,则划为连续喷发成交量。
为表述方便,我们套用地理中的“峰、岭、谷”定义。横看成岭侧成峰,地理中将孤耸的高山称为“峰”,将连绵的高山称为“岭”,将高山之间的低洼地带称为“谷”。因此,本报告中,我们将温和成交量称为“量谷”,将连续喷发成交量称为“量岭”,将孤立喷发成交量称为“量峰”。
“峰、岭、谷”的划分方式中,“量谷”反映了个股日内的交易低迷时点,以小额交易为主。“量峰”和“量岭”均是大额交易时点,二者的区别在于:“量峰”时点的大额交易没有资金跟随交易,其局域交易情绪低迷;“量岭”的大额交易有资金跟随交易,其局域交易情绪高涨。
本报告中,我们按“峰、岭、谷”的标准划分交易时点,构建了11个大类的20个有效因子(如图3所示,√代表有效因子,×代表无效因子)。前5个因子类型针对“峰、岭、谷”分别独立构建共13个因子,后6个类别则将“峰、岭、谷”按不同方式结合,构建共7个因子。
我们认为,量岭的跟随交易与个人投资者的交易特征更加相符;量峰的大额交易发生在情绪低迷处,与知情交易者的交易特征更加相符;量谷则是日内情绪低迷时点,其价格过度反应概率更低。因此,对于量谷时点,价格、收益类因子更加有效,且为正向因子;对于量峰时点,分钟数、成交额类因子更加有效,反映知情交易参与度,为正向因子;对于量岭时点,分钟数、成交额类因子反映个人投资者参与度,价格、收益类因子反映个人投资者的过度反应,均比较有效,且均为负向alpha贡献。
02
量峰分钟数因子多空年化收益31.58%
我们简单统计过去20日量峰的分钟数,作为量峰分钟数因子。因子衡量日内的知情交易参与频率,因子值越高,知情交易参与度越高。
本报告的因子测试中,对因子做市值、行业中性化处理,月频调仓,费率为双边千三,测试区间为20130101-20250531(下文未做特别说明,则同处理方式)。
量峰分钟数因子RankIC均值10.62%,RankICIR4.36。从全市场表现来看,多头组年化收益率14.36%,多空组合年化收益率31.58%,年化IR3.22,最大回撤9.43%,月度胜率79.73%,多空组合表现稳健。
从分年度表现来看,量峰分钟数因子多空组合所有年份均录得正收益,且大多数年份收益超30%。
从分域表现来看,量峰分钟数因子更加适用小市值股票池。在沪深300中,多空组合年化收益率9.99%,年化IR1.05;在中证500中,多空组合年化收益率14.96%,年化IR1.66;在中证1000中,多空组合年化收益率24.73%,年化IR2.94。
从分年度表现来看,量峰分钟数因子在中证500与中证1000中,所有年份均录得正收益,且多数年份收益较高。在沪深300中除2019年与2021年出现负收益外,其余年份录得正收益。
类似的,我们构建了量岭分钟数因子,衡量个人投资者交易参与频率。因子RankIC均值-9.04%,RankICIR-3.13。从全市场表现来看,多头组年化收益率13.37%,多空组合年化收益率26.2%,年化IR2.2,最大回撤15.56%,月度胜率69.6%。
03
量岭分钟收益因子多空年化收益14.98%
我们计算过去20日量岭时点的累计收益作为量岭分钟收益因子,衡量个人投资者交易的收益贡献,个人投资者交易的过度反应,导致量岭分钟收益因子为显著负向因子。
量岭分钟收益因子RankIC均值-6.29%,RankICIR-3.55。从全市场表现来看,多头组年化收益率7.47%,多空组合年化收益率14.98%,年化IR1.73,最大回撤13.84%,月度胜率70.3%。
从分年度表现来看,量岭分钟收益因子多空组合所有年份均录得正收益,2023年至2025年收益偏弱。
04
量谷相对加权价格因子多空年化收益25.35%
在开源金融工程团队2020年的报告《聪明钱因子模型的2.0版本》中,我们从分钟行情数据的价量信息中,通过分钟成交量的价格冲击程度,尝试识别机构参与交易的多寡,最终构造出一个跟踪聪明钱的选股因子。样本外5年中,聪明钱因子始终表现稳健。
本节,我们参考聪明钱因子的构建方式,计算每日量谷的成交量加权价格,与当日总成交量加权价格做比,并计算20日均值作为量谷相对加权价格因子。考虑到量谷时点交易情绪低迷,其价格过度反应概率较低,因此其价格相对水平越高,个股未来表现越好。
量谷相对加权价格因子RankIC均值8.69%,RankICIR4.44。从全市场表现来看,多头组年化收益率12.03%,多空组合年化收益率25.35%,年化IR3.04,最大回撤12.59%,月度胜率79.7%。
从分年度表现来看,量谷相对加权价格因子多空组合所有年份均录得正收益,2021年之前收益均在20%以上,2021年以来收益有所下滑,2024年、2025年收益偏弱。
从分域表现来看,量谷相对加权价格因子在沪深300中,多空组合年化收益率8.18%,年化IR0.99;在中证500中,多空组合年化收益率9.94%,年化IR1.26;在中证1000中,多空组合年化收益率19.89%,年化IR2.66。
从分年度表现来看,量谷相对加权价格因子在中证1000中,所有年份均录得正收益,且多数年份收益较高。在沪深300中,在2019年、2021年和2023年出现负收益,其余年份录得正收益,2025年以来年化收益率22%。在中证500中,除2022年和2023年外,其余年份均录得正收益,2025年收益偏弱。
类似的,我们构建了量岭相对加权价格因子,衡量个人投资者交易的价格相对水平。因子RankIC均值-6.27%,RankICIR-3.77。从全市场表现来看,多头组年化收益率8.35%,多空组合年化收益率17.99%,年化IR2.27,最大回撤10.49%,月度胜率77%。
05
量谷加权价格分位点因子多空年化收益20.22%
本节,我们将“日内最高价、日内最低价、昨日收盘价”三者的最高值与最低值作为[昨收,今收]区间的价格高低位,并计算每日量谷成交量加权价格的相对分位点,将20日的分位点均值作为量谷加权价格分位点因子,衡量交易低迷时点的价格水平。考虑到因子计算中正向暴露20日反转因子,我们进一步对量谷加权价格分位点因子做反转中性化处理。
量谷加权价格分位点因子RankIC均值6.34%,RankICIR4.32。从全市场表现来看,多头组年化收益率13.1%,多头组收益贡献显著,多空组合年化收益率20.22%,年化IR3.29,最大回撤10.18%,月度胜率80.4%,相较于量峰加权价格分位点因子表现明显更稳健。
从分年度表现来看,量谷加权价格分位点因子多空组合除2025年外,其余年份均录得正收益,且大多数年份收益较高。
从分域表现来看,量谷加权价格分位点因子在沪深300中,多空组合年化收益率9.35%,年化IR1.25;在中证500中,多空组合年化收益率11.71%,年化IR1.76;在中证1000中,多空组合年化收益率14.98%,年化IR2.59。
从分年度表现来看,量谷加权价格分位点因子在沪深300中,除2021年外其余年份均录得正收益,2025年以来年化收益率16.7%。在中证500中,多数年份均录得正收益,2025年因子回撤较大。在中证1000中,仅2025年出现负收益,其余年份录得正收益。
类似的,我们构建了量峰加权价格分位点因子,衡量知情交易价格的相对水平。因子RankIC均值3.47%,RankICIR2.9。从全市场表现来看,多头组年化收益率6.82%,多空组合年化收益率11.2%,年化IR1.88,最大回撤11.8%,月度胜率71.6%。
06
量峰间隔峰度因子多空年化收益23.3%
本节中,我们针对两个量峰之间的时间间隔计算统计指标,对过去20日同日前后两个量峰之间的时间间隔分布,计算其峰度作为量峰间隔峰度因子。
量峰间隔峰度因子RankIC均值7.19%,RankICIR4.63。从全市场表现来看,多头组年化收益率11.78%,多空组合年化收益率23.3%,年化IR3.39,最大回撤7.37%,月度胜率82.4%。
从分年度表现来看,量峰间隔峰度因子多空组合所有年份均录得正收益,且多数年份收益较高。
从分域表现来看,量峰间隔峰度因子在沪深300中,多空组合年化收益率7.63%,年化IR1.05;在中证500中,多空组合年化收益率9.93%,年化IR1.43;在中证1000中,多空组合年化收益率17.09%,年化IR2.76。
从分年度表现来看,量峰间隔峰度因子在中证500与中证1000中,所有年份均录得正收益。在沪深300中,2019年、2021年及2023年出现负收益,2025年以来年化收益率16.3%。
类似的,我们分别构建了量峰间隔标准差因子、量峰间隔偏度因子、量岭间隔标准差因子、量岭间隔偏度因子和量岭间隔峰度因子。
量峰间隔标准差因子RankIC均值-8.57%,RankICIR-3.99。从全市场表现来看,多头组年化收益率10.74%,多空组合年化收益率25.66%,年化IR2.93,最大回撤9.86%,月度胜率79.1%。
量峰间隔偏度因子RankIC均值7.68%,RankICIR4.58。从全市场表现来看,多头组年化收益率11.56%,多空组合年化收益率24.56%,年化IR3.37,最大回撤7.56%,月度胜率80.4%。
量岭间隔标准差因子RankIC均值7.34%,RankICIR3.75。从全市场表现来看,多头组年化收益率12.59%,多头组收益贡献较高,多空组合年化收益率18.41%,年化IR2.23,最大回撤8.63%,月度胜率70.3%。
量岭间隔偏度因子RankIC均值-8.08%,RankICIR-3.82。从全市场表现来看,多头组年化收益率12.32%,多空组合年化收益率22.19%,年化IR2.66,最大回撤7.07%,月度胜率73.7%。
量岭间隔峰度因子RankIC均值-7.61%,RankICIR-3.77。从全市场表现来看,多头组年化收益率10.25%,多空组合年化收益率19.47%,年化IR2.45,最大回撤7.21%,月度胜率72.3%。
07
“峰、岭、谷”的信息组合
前文针对“峰、岭、谷”独立构建相关因子,本部分,我们尝试将三者相互结合,构建价格比、成交额比、相关性等因子。
7.1、 谷岭加权价格比因子多空年化收益15.83%
如前文所述,量谷时点交易低迷,价格过度反应概率较低,量岭时点个人投资者交易使得价格过度反应概率较高。因此,我们计算每日量谷成交量加权价格,与量岭成交量加权价格做比,并计算20日价格比均值作为谷岭加权价格比因子。因子值越高,个人投资者过度反应使得价格向下偏离程度越高,个股未来表现越好。
谷岭加权价格比因子RankIC均值6.98%,RankICIR3.56。从全市场表现来看,多头组年化收益率11.5%,多空组合年化收益率15.83%,年化IR1.83,最大回撤11.73%,月度胜率72.3%。
从分年度表现来看,谷岭加权价格比因子仅2023年出现负收益,其余年份均录得较高正收益。
从分域表现来看,谷岭加权价格比因子在沪深300中,多空组合年化收益率9.73%,年化IR1.21;在中证500中,多空组合年化收益率10.49%,年化IR1.34;在中证1000中,多空组合年化收益率12.91%,年化IR1.76。
从分年度表现来看,谷岭加权价格比因子在中证1000中所有年份均录得正收益,2021年、2023年收益偏弱。在沪深300中,2021年与2023年出现负收益,其余年份均录得正收益。在中证500中,2023年和2025年出现负收益,其余年份均录得正收益。
类似的,我们构建了峰岭加权价格比因子,因子RankIC均值4.7%,RankICIR3.61。从全市场表现来看,多头组年化收益率5.3%,多空组合年化收益率10.31%,年化IR1.81,最大回撤11.41%,月度胜率68.9%。
7.2、 峰岭成交比因子多空年化收益27.13%
本小节通过计算20日量峰总成交额与量岭总成交额,二者做比作为峰岭成交比因子,衡量知情交易相对个人投资者交易的相对参与程度。峰岭成交比因子RankIC均值10.28%,RankICIR4.07。从全市场表现来看,多头组年化收益率16.06%,多头组收益贡献显著,多空组合年化收益率27.13%,年化IR2.89,最大回撤7.88%,月度胜率74.3%。
从分年度表现来看,峰岭成交比因子多空组合所有年份均录得正收益,2025年收益偏低,其余年份均有较高收益表现,多数年份收益超20%。
7.3、 喷发成交额跟随比例因子多空年化收益30.09%
如前文所述,将喷发成交划分为量峰与量岭,二者均代表大额成交时点,但区别在于,量峰的大额成交没有资金跟随,量岭的大额成交有资金跟随。因此,本节将过去20日喷发成交时点的总成交额作为分母,将喷发成交时点的下一分钟总成交额作为分子,从而衡量大额成交后的资金跟随程度,作为喷发成交额跟随比例因子,资金跟随程度越高,则个股交易中的个人投资者交易占比越高,个股未来表现越弱。
喷发成交额跟随比例因子RankIC均值-10.59%,RankICIR-3.9。从全市场表现来看,多头组年化收益率16.13%,多空组合年化收益率30.09%,年化IR2.85,最大回撤9.8%,月度胜率73.65%。
从分年度表现来看,喷发成交额跟随比例因子多空组合所有年份均录得正收益,且多数年份收益超20%。
类似逻辑下,我们构建了喷发成交额敏感度因子与喷发成交额相关性因子。
我们将过去20日喷发成交时点分钟成交额作为自变量,将喷发成交时点的下一分钟成交额作为因变量,从而衡量分钟成交额对大额成交的敏感度,作为喷发成交额敏感度因子。喷发成交额敏感度因子RankIC均值-7.14%,RankICIR-3.58。从全市场表现来看,多头组年化收益率13.96%,多头收益贡献显著,多空组合年化收益率15.61%,年化IR2.18,最大回撤8.31%,月度胜率69.59%。
我们计算过去20日喷发成交时点分钟成交额与下一分钟成交额的相关系数,作为喷发成交额相关性因子。喷发成交额相关性因子RankIC均值-10.94%,RankICIR-3.99。从全市场表现来看,多头组年化收益率15.12%,多空组合年化收益率29.72%,年化IR2.73,最大回撤11.54%,月度胜率75.7%。
7.4、 同时点峰岭数相关性因子多空年化收益22.78%
本小节,我们统计过去20日同一时点的量峰与量岭样本数,并计算二者相关性,作为同时点峰岭数相关性因子。
同时点峰岭数相关性因子RankIC均值-6.67%,RankICIR-4.4。从全市场表现来看,多头组年化收益率10.09%,多空组合年化收益率22.78%,年化IR3.27,最大回撤8.39%,月度胜率80.4%。
从分年度表现来看,同时点峰岭数相关性因子多空组合所有年份均录得正收益,且多数年份收益较高。
从分域表现来看,同时点峰岭数相关性因子在沪深300中,多空组合年化收益率6.07%,年化IR0.83;在中证500中,多空组合年化收益率9.96%,年化IR1.44;在中证1000中,多空组合年化收益率18.13%,年化IR2.9。
从分年度表现来看,同时点峰岭数相关性因子在沪深300中,2021年出现较高负收益。在中证500中,仅2025年出现负收益,其余年份均录得正收益。在中证1000中,所有年份均录得正收益。
08
补充材料:因子相关性及分域表现
本报告中,我们通过将日内分钟成交量按照“峰、岭、谷”划分,从而对日内信息进行切割,基于此构建了11个大类共20个有效因子。从与Barra风格因子相关性来看,部分因子在波动率、流动性上有较高暴露(如分钟数类因子、时间间隔统计指标类因子等)。
从因子间相关性来看,量峰分钟数因子与多个因子存在较高相关性。其中,与量岭分钟数因子负相关69%,与量峰间隔标准差、峰岭成交比、喷发成交额跟随比例等因子相关性绝对水平超过80%,属于同一逻辑的不同表达。量峰间隔峰度因子与量峰间隔偏度因子之间相关性高达98%。量谷加权价格分位因子与量峰加权价格分位因子之间相关性66%。
如表18所示,多数因子在Barra风格、行业中性后,仍保持较高有效性。
由于篇幅限制,前文仅从因子间相关性维度出发,挑选个别相关性偏低的因子做分域回测,其余因子在各分域有效性可参考表19。
上一篇:求超级血腥和暴力的电影
下一篇:男朋友总不约我出去是怎么回事?