引言和概述
2023年3月17日温哥华时间晚7点,由温哥华清华校友会主办的“清华紫荆讲坛”第三讲正式拉开帷幕。紫荆讲坛于2021年夏天正式推出,立足于“立德立言,无问西东”的原则,传播学术知识和中西文化,服务校友,回馈社会,并同时对校友和公众开放。
本次讲坛主题为“金融投资的未来—人工智能、量化交易和ChatGPT”,主讲人为清华大学经管学院张晓泉教授,讲座由温哥华清华校友会会长何维国主持,清华校友边显人作为嘉宾采访人,约有350余位清华校友及公众参加。张晓泉教授围绕人工智能如何应用于投资的历史和现状,量化投资的已知与未知,以及金融投资未来发展趋势进行了深入探讨。演讲结束之后,听众针对市场超预期波动、金融投资从业人员的职场前景等话题展开了热烈的讨论。
主讲人张晓泉教授,清华大学92级双学士(英语文学、计算机科学双学士)及96级硕士(经济管理),麻省理工学院管理学博士。清华大学经管学院Irwin and Joan Jacobs讲席教授,国家级人才计划讲席教授,清华大学国际研究生院创新管理研究院常务副院长。同时担任麻省理工学院数字经济研究所(MIT Initiative for Digital Economy)和德国欧洲经济研究中心(ZEW)的特邀研究员。他此前是香港中文大学商学院副院长和决策科学与管理经济学系的讲席教授,亚太商业研究所(Asia Pacific Institute of Business)的联席执行主任,香港深圳金融研究中心(Hong Kong-Shenzhen Finance Research Centre)的联席主任。顶级期刊发表的学术论文被引用近万次,多家顶级学术期刊的高级主编。他是超量子量化私募基金创始人,芝加哥量化联盟成员。
为方便读者,我们整理小结了张晓泉教授的讲座,小结以演讲者的人称撰写,以带来更好的连贯性和代入感。
AI模型进行量化投资时的底层逻辑
人工智能在进行量化分析时实际在做这么一件事情——在不确定性中寻找确定性。从科学的角度分析它应该具备可证伪与可复现两个特点。可证伪性是指对于一个事实的陈述,必须容许逻辑上的反例存在;可复现性指总结出来的规律,例如太阳恒从东方升起,能够在未来持续复现才可被认为是科学的。
这种方法论指导着我们如何在金融市场中寻找确定性。2020年2月美股经历了一次重大股灾。但其实早在危机前一个月,我们的模型已经报出了美股可能很快出现危机的预警信号。2020年1月19日,我在公众号上发表了一篇文章,建议持有美股的读者可以减仓避险,当然了,如果想冒险的话甚至应该做空。美股随即在三月份大幅下跌、甚至出现了罕见的四次熔断。一些朋友后来也告诉我因看了这篇文章才清空了退休账户里的美股持仓,所幸躲过了这次风险。我们团队由于有模型的信号,可以抓住这样的市场机会得到了非常好的收益。
给大家展示一下我们当时的模型。图中绿线是美股单周收益率。这条线上可以找到1987年10月19日的股灾,2000年的互联网泡沫,以及2008年的金融危机。这些时间点上的收益率均体现为剧烈下探。橙色线是恐慌指数VIX,也叫隐含波动率,是用期权定价模型推算的。可以看到每次隐含波动率向上猛窜的时候,都代表股灾正在发生。
蓝线是我们在自己数学模型里把不合理的假设弱化之后算出来的。当蓝线每次从高点迅速穿越0.1水平线时,股灾基本上会在不久的将来降临。所以2020年初当它下穿0.1临界线时便敲响了一次典型的预警。
事实上,我的预测部分基于人工智能,另一部分则使用了自己的数学模型。这些数学模型是从某个理论出发、不断向下推导得到的。现有的传统金融理论最大的问题在于其假设性过强,强假设所推导出来看似完美的结果,却可能与实际情况非常不相符。因此,我们在开发经济金融模型时会削弱里头过强的假设,这样推导出来的新指标才能为我们提供更正确、有效的信息。
理解基金
大家都知道目前基金分为公募和私募两种类型。公募基金可以公开推广,对投资者要求门槛较低,但对管理人的门槛较高,需要遵守证券监管机构的多项限制,包括但不限于禁止做空、限制投资标的范围、约束换手频率、需要特定牌照等等。
私募基金则主要面向高净值和机构投资者。它的好处是让管理人在投资策略上享有更大的自主权,可以投多样化标的,采取灵活多样的策略等。费率方面,公募收费相对私募低得多,中国公募的收费水平大概仅在千分之五,而私募收2%的管理费外加业绩报酬。当然,投资者们也会对私募回报率的期望值高许多。
中美股票市场量化投资对比
中国股票市场现有总市值达80万亿人民币,不到美股市场40万亿美元的3成,并且美股里的机构交易者占比高达94%,而中国机构交易者仅占A股的32%。这些机构交易者里美国的量化私募规模已超过60%,而中国量化私募的管理规模占比仅略高于1%。这些数据都表明中国量化的发展还具有极其广阔的空间。
量化和主观投资的区别
主观投资类似于巴菲特的那套价值投资理念,量化投资则利用数据和数学模型进行投资决策。但我想指出的是两者的区别其实没有想象中那么大。同是从股票市场里赚钱,量化和主观的收益均来源于两部分:一是beta,即大盘本身的上涨下跌。二是α,即能够利用信息差或找到错误定价的能力。信息差是指你掌握着他人不知道的信息,错误定价则是那些巴菲特热爱买入的“被低估的公司”所具备的价值。只是与老巴的“长周期持仓、等待价值回归”的做法不一样,量化更善于寻找于未来五天、十天又或是几秒钟的错误定价。
巴菲特具备很强的投研能力,可以极为深入地调研某些行业、公司,他的投资策略较为集中,回报率也很高。但华尔街也有一句话叫做“天下唯一的免费午餐,就是分散风险”,而量化正是采取了分散持仓的方式实现投资回报。巴菲特在30年间取得了高胜率,但他每年进行交易次数很少。在最早期人们也花了很长的时间才判定这是一支优秀的管理人团队。量化每年则可能交易数万次,正因有了这样大量的交易数据,大家能更容易判断一家量化公司是否能够战胜市场,逐步做大。
另一方面,胜率并非越高越好,它可能是以极高的风险为代价换来的。因此我们需要关注策略的收益来源,即归因钱是如何被赚到的。我们更不应该盲目追逐那些短期涨得好的股票或基金,因为短期好的策略往往运气成分很大。我们需要了解策略的底层方法论,这是决定着策略持续迭代的法则。
人工智能在金融行业的应用
人工智能目前只能做两件事情,预测和分类。预测是通过已有数据找到规律并得出公式来进行预测,分类则是通过找到方程进行画线来划分不同的类别。
量化投资是将投资组合的收益率进行拆解,如无风险收益(定存利率)、市场收益率、以及未知因素等变量来拟合出最贴近实际市场表现的公式。
在此还想介绍一下我们总结的超量子策略金字塔,可见分为四层。我们认为要找到全局最优的模型,需要在最底下两层做优化:第一个是科学层面,科学研究成本很高,也相当耗时,但是一旦有突破就可能发现一片崭新的蓝海;第二个是艺术层面,所探讨的这一系列问题的成果都应该被加入到模型当中。这些即便是美国和中国都很少有团队能发现、有能力解决。我认为科学和艺术层面依然有很大的优化和发展空间。
谈谈ChatGPT和量化的未来
大家总是人为地希望ChatGPT能产生情感、意识,实际上还差得相当远。仔细读过ChatGPT的白皮书的人就会发现它更多像是语言模型,而不是思维能力。比如说它可以从篇幅较长的研报里进行归纳总结,帮助投研人员省下很多阅读时间,但却没有办法像量化擅长的那样做出预测。
我个人思考是ChatGPT能帮忙模拟股票数据。数据不够是量化目前一个很大的瓶颈,而ChatGPT能有上千亿的参数(新出的GPT4达100万亿个参数),并且可以生成符合金融规律的数据。
与此同时,量化投资需要同时采用归纳法和演绎法。归纳法是通过观察市场数据,找到规律并形成假说,从而得到结论。而演绎法则是从理论出发,通过数据观察来验证理论的正确性。当这两种方法结合得好时,量化投资未来将会有一个非常大的发展空间。
最后,分享一个我经常喜欢打的比喻,金融市场像是大海,各种策略就好比不同的鱼类。它们都有着各自的生态系统和生存的理由。每种策略赚钱方式不一样,并非拥有机器、速度更快就一定可以灭绝其它策略,毕竟即便是鲨鱼也不能吃光所有小鱼,但是强鲨鱼可以消灭弱鲨鱼。我所认知的金融市场生态里,量化跟主观是可以共存的。
部分问答
最后的问答环节非常热烈,由清华大学经管学院校友边显人主持,我们选取以下两个具有代表性的问题以飨读者:
第一个问题是:对于金融行业的从业者,人工智能对于职业路径的选择意味着什么?是更宽广了,还是会更加艰难?
张晓泉教授的回答是:人工智能肯定是拓宽了这个行业的。推荐大家去看一本书,讲述西蒙斯的《战胜市场的人》。那本书描述了西蒙斯当时是怎么创业,怎么开始做量化投资。其实他们当时做了非常多的工作,那些基础数据都没有,需要手工地去收集数据,自己建构建一套系统去做。
实际上随着人工智能理论的发展,肯定会有更多的工具,这些工具会帮助我们更深刻地理解市场,所以肯定是一个好事。反过来,人工智能以前可能是一个华丽的词,大家会觉得我做金融市场,我不需要理解这个东西。但是现在大家的共识是它是一个必修课了。你不管以前是用什么方法的,现在人工智能你必须得懂,不懂你真的从知识结构上会被人替代掉。
第二个问题是关于中国量化基金的发展前景。因为目前看来中国国内的公募、私募的量化的使用情况还是暂时落后于西方的发展的。您看未来国内会不会在这个行业有更多的个人职业发展机会?
张晓泉教授的回答是:有非常大的机会。我并不是觉得中国的机构落后于美国,它只是一个管理规模上的。从策略上讲,甚至中国有点弯道超车后发优势。美国的这套体系很多是做线性多因子模型,中国一上来,很多人就开始用机器学习了,所以中国等于一下子跳到了机器学习的时代。但是发展上确实是美国的这些量化各自是有一套自己的方法论的,中国其实大多数量化比较相近,相近最大的坏处就是在一个大海的生态系统里面都是同一种鱼。首先你是可能找不到很多吃的东西,你们互相要去抢同样的东西吃。其次,如果得病,市场出现了一些风险,大家都会得同一种病。中国有第一家超过百亿管理规模的量化,也是2019年的事,所以非常迟。在过去这几年发展非常快,但是仍然是一个非常初期的阶段。所以我自己的观点,可能未来几年之内会重新洗牌,会有一些非常好的这些机构形成一个生态圈,大家有各自的不同的方法论去形成了一个好的生态系统。
结语
本次讲座获得了校友和听众的广泛好评,大家纷纷留言,表达对张晓泉教授和温哥华清华校友会的赞赏以及一些建设性的建议。我们将以此作为激励,努力主办更好的活动回馈校友和公众。温哥华清华校友会感谢各位校友和公众对“清华紫荆讲坛”的支持,也感谢长江集团、CHLOE、Aurice Technology对校友会和讲坛的友情赞助。我们后续还将陆续推出其他讲座和活动,敬请关注。同时敬请关注校友会公众号。
主讲人:清华大学经管学院Irwin and Joan Jacobs教授张晓泉教授
策划+主持:何维国(清华大学1992级外语系本科,1996级法学院研究生)
撰稿:何清(清华大学2014级经管学院),何维国(清华大学1992级外语系本科,1996级法学院研究生)
技术支持:薛松(清华大学1995工物系)、陈思(清华大学2008级法学院)
编辑+设计:肖礼斌(清华大学建筑学院1989级本科、1994级硕士,2003级博士)
采访:边显人(清华大学2004级经管学院)
总务:王渝(清华大学1986级电机系)
讲座主办:温哥华清华校友会