光大保德信基金朱剑涛:当公募基金量化团队用上了机器学习模型

500

曲艳丽 | 文

DeepSeek由知名私募巨头幻方量化孕育而生。坊间推测,DeepSeek也沿用了幻方量化的一部分金融相关的方法论。2016年,梁文峰团队推出深度学习算法驱动的AI模型,率先将GPU用于计算交易仓位。2018年,幻方曾获私募金牛奖。

从DeepSeek所展现的人才密度和算力密度,可以反向推测,量化私募对于计算机技术的应用已经到了炉火纯青的地步。

量化是金融、数学的交叉学科,在这方面,量化私募走得比较前面,比如在之前备受争议的高频交易领域,量化私募是主力,某种程度上也给人一种「黑箱」之感。

公募基金服务于大众,监管和合规更严格,量化更多运用在被动型指数、指数增强、多因子选股等领域。

随着技术发展,公募基金对于AI的应用,也亦步亦趋,按照自己的节奏在快速发展着。比如,近年来,公募基金行业也逐渐将机器学习策略应用到量化指增产品上。

据悉,光大保德信基金是行业内较早将「机器学习模型」纳入实盘策略的公募之一。

1.

光大保德信基金量化团队的负责人是朱剑涛。

他拥有16年量化研究经验,先后就职于华宝信托、海通证券、东方证券、海南进化论私募,曾担任东方证券量化首席分析师、数量金融创新实验室负责人、东证衍生品研究院副院长、进化论私募量化研究负责人。

2024年5月起,朱剑涛担任光大量化核心、光大一带一路的基金经理,现任光大保德信基金量化业务负责人、基金经理。

朱剑涛构建量化投资框架,有两大特点:

其一,他是一个「细节控」。

其二,他很注重「逻辑先导」,再以数据和模型来验证。

2021年6月,朱剑涛当时担任东方证券研究所量化首席分析师,他就接受采访,将量化投资的概念更视之为「系统化投资」。

朱剑涛认为,一整套量化投资体系,由诸多个模块构成,从数据处理、人工扩建因子库、机器学习挖掘因子、风险控制、组合优化,如果每一个地方差一点,堆叠起来就不可控了,必须重视细节。

他在整个过程中秉承着一种追求稳健的思想。

举个简单例子,做数据处理的时候,传统最常用的均值、方差统计量的计算都会受到异常值的影响,采用分位数或者一些其它的稳健统计量能够有效降低异常数据干扰。

量化投资的核心部分是alpha模型,也就是一套「给股票打分」的机制。

3月3日起,朱剑涛的新基金光大保德信红利量化混合A(A类:023106 C类:023107)正式发行。

如前述,这是一只将「机器学习模型」纳入实盘策略的主动量化产品。

过去,光大保德信基金量化团队将这一套底层打分模型,先运用到光大中证500指数增强A上。该指增产品结合机器学习模型运作,实盘业绩可圈可点。①

新基金光大保德信红利量化混合A(A类:023106 C类:023107)产品的跟踪误差力争控制在指增产品和SmartBeta之间,比起指增,跟踪基准的行业偏离容忍度和跟踪误差容忍度都更高一些,发挥空间更大,它的选股池也比中证红利指数更宽泛。

朱剑涛认为,低利率环境下,对红利产品的配置需求长期存在,这个群体很大。

「目前时点,很多利好因素都在快速释放。」他评价当前市场。

2.

光大保德信基金量化团队为何要采用机器学习模型?

据悉,机器学习模型相当于在传统的多因子模型上进一步扩充。

「人工构建选股因子时,寻找一个新的选股因子不难,但是找到一个跟已有因子库相比有明显增量的因子,难度很大。」朱剑涛称,人为构建选股指标可以成百上千个,但彼此之间信息重叠度比较大,增量有限。因此,传统的多因子模型有瓶颈,数量级别在100-200个的选股因子库,基本能够覆盖到市场上常见的alpha来源。

所以,光大保德信基金量化团队借助GPU的算力、以及机器学习模型的强分析能力,寻找新的因子。

众所周知,人工智能的三架马车,分别是:算力、算法、数据。

用以衡量公募基金量化投资框架的底层架构,实际上的关键因素也有三个:策略、模型、数据。

事实上,量化投资的出发点很多与主动策略耦合,方法论是多因子选股,即从数据出发,寻找选股指标,给股票打分。

是的,它的核心是一种「给股票打分」的机制。

先说策略。

传统的多因子量化选股模型是人为构建一些选股指标(因子)。

常见因子包括盈利、成长、估值、分析师预期、量价、高频等。

光大保德信基金量化投资负责人朱剑涛管理的量化团队会通过GPU(显卡)挖因子。方法论是对原始数据做最基本加工,如降噪、归因化处理,之后输入光大保德信基金自研的机器学习模型,让它预测未来一段时间不同股票、不同频段的涨跌幅。

这些因子、或者称之为选股指标、或者「策略」,本身就来源于主动权益策略或者资产定价、行为金融理论、学术文献、市场经验等。但这些已经被大家发现了的策略,有时候,超额收益已经是被市场捕捉过了的,所以量化团队还需要一些独家的东西。

在机器学习的预测过程中,有一些隐藏的单元是非常有效的选股指标,朱剑涛将这些选股指标提取出来,合在一起。

也就是说,采用机器学习,是为了发现一些人力无法发现的东西。在这一部分,光大保德信基金量化团队在运行的,是一个纯粹的由机器学习模型驱动的策略,在业内是有一定先进性的。

光大保德信基金量化团队每年可以挖出600个左右选股指标,量大且相关性低,跟人工构建的因子库形成很好的互补。他们会对这些因子进行动态加权,相当于给因子一个权重,之后合成股票打分。

有了股票打分,相当于给股票做了排序,选择得分较高的股票。

3.

量化投资中,数据是驱动一切的最底层、最核心的要素。

跟主动权益相比,光大保德信基金量化团队增加了相当一块有效数据,即Level2高频逐笔成交数据。

Level2高频逐笔成交数据,是目前国内证券市场上颗粒度最为精细的交易信息数据,包含大量有价值的信息,利用这些数据生成交易信号和获取收益已经成为量化研究中的一种主流策略。

此外,光大保德信基金量化团队还增加了一块另类数据,包含很多非表格化数据。举个例子,文本舆情就属于这一类。

另类数据基本上是外购,目前市场上能够提供的另类数据很多,在验证了数十种另类数据之后,朱剑涛选择了产业链数据,产业链的网状结构中包含着很多联动信息。一些新数据,必须借助机器学习、神经网络来加工。

再说模型。

光大保德信基金量化团队的机器学习模型,是「基于损失函数的全量学习」,并非强化学习。

这是因为,金融是一个「高信噪比市场」。

在金融领域,无论如何穷尽理论、经验或者高基数,大部分问题仍然无法使用模型来定量解释。朱剑涛团队也尝试过强化学习模型,但它对起点和噪音更敏感,稳定性较差。

光大保德信基金量化团队做模型是一个化繁为简的过程,与大家想象得恰好相反。

他们做机器学习模型,先给一个很复杂的模型,让它学习,具备足够多的表达能力,然后再降低复杂性,用数据把复杂性一点点剪裁到合适的位置,让模型更稳。

团队的开发工作,大部分时间用于研究如何降低复杂性,用「正则化方法」提升模型的样本外泛化能力。

如此,模型对噪音的敏感度更低。

据悉,光大保德信基金也在本地部署了DeepSeek蒸馏版本,目前运用于提升投研工作效率,还没有到达直接做投资决策、提升收益率水平的程度。

4.

做指数增强,要控制跟踪误差,相当于「戴着镣铐起舞」。

因此,模型还有重要一点:要控制组合跟基准不能偏离太多。

于是,光大保德信基金量化团队独立开发了一套「风险模型」。

跟海外版商业风险模型相较,这套风险模型的最大差别,就是加入了两个A股特有的风险因子,一个是A股国企属性,另一个是信息确定性指标。

因此,模型对市场波动的解释度较海外市场的模型更高。

有了基础模块之后,实盘运营就是将模块做成流水线的标准流程,服务器上有不同的定时运营任务对数据进行更新维护。

综上所述,有了数据、策略、模型,光大保德信基金量化团队通过人工构建一些因子,机器学习挖掘一些因子,合在一起,构成股票打分。

有了alpha预测收益这部分,量化团队把它放到组合优化器,求解组合优化问题,得出目标仓位,目标仓位跟现有持仓的差额就是交易清单,把交易清单交给光大保德信基金的算法交易系统。

事后,再分析交易结果,看风险暴露是否偏离设想、交易计划冲击成本是否太大、做出反馈调整。不同模块之间是相互反馈、相互改进的流程。

以上,就是光大保德信基金量化团队一整个「从数据到交易」的流程。

数据来源:光大中证500指数增强近一年/近两年收益率分别为24.06%、8.81%%,同期业绩比较基准分别为14.87%、-4.15%,业绩基准为50%*沪深300指数收益率+50%*中证全债指数收益率。上述业绩表现截至2025/2/17,相关数据已经托管行复核。

重要提示:朱剑涛先生,2008年毕业于复旦大学,获得理学硕士。2008年7月至2010年8月在华宝信托有限责任公司任职量化研究助理;2010年9月至2015年3月在海通证券股份有限公司任职金融工程高级分析师;2015年4月至2022年5月在东方证券股份有限公司任职金融工程首席分析师;2022年6月至2023年8月在海南进化论私募基金管理有限公司任职量化研究负责人;2023年8月加入光大保德信基金管理有限公司,现任权益管理总部量化投资团队副团队长(主持工作),2024年5月至今担任光大保德信量化核心证券投资基金、光大保德信主题混合型证券投资基金的基金经理,2024年10月至今担任光大保德信风格轮动混合型证券投资基金、光大保德信诚鑫灵活配置混合型证券投资基金、光大保德信多策略智选18个月定期开放混合型证券投资基金、光大保德信中证500指数增强型证券投资基金的基金经理。2025年3月,拟任光大保德信红利量化选股混合型证券投资基金的基金经理。

王卫林先生,北京大学软件工程专业硕士。2016年7月至2018年1月在南方基金管理有限公司任职量化研究员;2018年1月至2023年2月在长城基金管理有限公司任职量化与指数投资部研究员、基金经理助理、基金经理;2023年2月加入光大保德信基金管理有限公司,现任权益管理总部量化投资团队基金经理,2023年8月至今担任光大保德信量化核心证券投资基金、光大保德信中证500指数增强型证券投资基金、光大保德信创业板量化优选股票型证券投资基金、光大保德信锦弘混合型证券投资基金的基金经理。

风险提示:基金有风险,投资需谨慎。在进行投资前敬请投资者仔细阅读《基金合同》、《招募说明书》、《产品资料概要》等法律文件,光大红利量化产品风险等级为R3(中风险)适合风险评级C3(平衡型)及以上的投资者。敬请投资者关注产品的风险等级与自身风险评级进行独立决策。本材料不构成任何法律文件或是投资建议或推荐。基金管理人承诺以诚实信用、勤勉尽责的原则管理和运用基金资产,但不保证上述基金一定盈利,也不保证最低收益。本基金募集规模上限为30亿元人民币(不包括募集期利息)。基金管理人可对募集期的销售规模进行控制,具体规模控制的方案详见届时相关公告(如有)。上述基金的过往业绩、净值高低、获奖情况及相关行业排名并不预示其未来业绩表现,基金管理人管理的其他基金的业绩不构成对上述基金业绩表现的保证。基金的投资范围包括港股,会面临因投资环境、投资标的、市场制度以及交易规则等差异带来的特有风险,基金资产并非必然投资于港股。本基金采用证券经纪商交易结算模式,可能存在信息系统风险、操作风险、效率降低风险、交易结算风险、投资信息安全保密风险等风险。本产品由光大保德信基金发行与管理,代销机构不承担产品投资、兑付及风险管理责任。

500

站务

全部专栏