论文标题:From Man vs. Machine to Man + Machine: The Art and AI of Stock Analyses
中文标题:从“人机对抗”到“人机协作”:股票分析中的艺术与人工智能
原文来源:Cao S, Jiang W, Wang J, et al. 2024. “From Man vs. Machine to Man + Machine: The art and AI of stock analyses.”Journal of Financial Economics,160: 103910.
供稿:刘智慧
封面图片来源:Pexels
编者按 :
文献构建了一个AI分析师模型,该模型能够消化公司财务信息、定性披露和宏观经济指标,并在股票价格预测方面超越大多数人类分析师。在2001年至2018年的样本期间,AI分析师在55.9%的目标价格预测中优于IBES分析师。AI的优势主要体现在其强大的信息处理能力和对透明且大量信息的处理上。然而,AI并非万能。当公司信息复杂、涉及大量无形资产或面临高流动性风险时,人类分析师的表现更为出色。这表明,在信息不对称和需要深厚行业知识的情况下,人类分析师的经验和直觉仍然具有不可替代的价值。
一、研究背景
文献的研究动机源于国际象棋大师卡斯帕罗夫的经历。1997年,IBM的深蓝击败了当时的国际象棋世界冠军,此后人机对弈的结果变得毫无悬念。然而,深蓝的出现也激发了卡斯帕罗夫等人开创“人机协同”比赛的概念,即人类棋手借助AI辅助(“半人马”选手)与AI对弈。至今,“半人马”选手在与AI的对弈中仍占据上风。如果AI能够帮助人类成为更好的棋手,那么它同样可以助力其他高技能职业,如飞行员、医生和投资顾问。该篇文献聚焦于股票分析行业,该行业数据的可获得性便于校准“人机对抗”和“人机协同”。股票分析师作为市场最重要的信息中介之一。他们的工作需要机构知识和数据分析能力,而AI的核心优势在于能够以较低成本快速做出强大预测。越来越多的投资者开始关注AI驱动的股票选择和投资组合构建建议。
为了追踪从“人机对抗”到“人机协同”的路径,文献构建了自己的AI模型,用来预测12个月的股票回报(从12个月的目标价格推断),与分析师同时对同一只股票的预测进行比较。“AI分析师”基于训练模型,能够消化公司披露和其他信息(定性和定量),并执行与股票分析师类似的预测任务。 总而言之,这篇文献基于集成模型构建AI分析师,使用2001-2018年的数据进行预测,并与同期人类分析师的预测进行比较,研究了“AI分析师在股票回报预测中是否优于人类分析师?以及在何种情境下AI或人类分析师更具优势?”的问题。
二、数据构建和机器学习模型
(一)信息集构建
为了构建能够与传统分析师竞争的AI分析师,文献定义了专业分析师在进行价格预测时可用的信息集。这个信息集包括来自CRSP和Compustat的公司和行业信息;来自公司SEC文件、新闻情绪和社交媒体覆盖率的文本信息;以及来自圣路易斯联邦储备银行的宏观经济数据
(二)机器学习模型的输入信息和变量
公司层面变量:包括财务指标、市场表现、公司规模、增长、投资、盈利能力、无形资产和交易摩擦等异常情况。这些变量基于公司披露的财务信息构建,每季度更新一次。
行业层面变量:涵盖竞争程度、行业动态等因素,如基于10-K文件的行业竞争度、产品市场流动性、Fama-French 48行业分类、行业规模和行业平均每股收益等。
宏观经济变量:包括工业生产指数、消费者价格指数、原油价格、3个月国库券利率、10年期国债利率和BAA–AAA收益率差等,这些数据来自圣路易斯联邦储备银行的联邦储备经济数据,按月更新。
文本情感信息:利用机器学习模型处理公司向SEC提交的文件中的非结构化文本数据,如年度报告(10-K)和季度报告(10-Q)。
(三)潜在影响AI和人类分析师表现的因素
研究的主要目标是评估影响AI与人类分析师相对表现的因素,以及两者之间的协同效应。研究假设这些因素与公司、行业和分析师的信息环境有关。虽然股票分析师通常在多个维度上被评估,但本文献专注于预测准确性,因为它是分析师评估的主要质量指标。研究涉及的关键变量有:
-表1- 描述性统计
(四)机器学习模型
模型选择:包括随机森林、梯度提升和长短期记忆神经网络等。这些模型在处理复杂横截面关系和时间序列模式方面具有优势。这些模型能够处理高维非结构化数据,并优化未指定函数形式的拟合。
模型训练与改进:研究者不断训练和改进模型,直到AI分析师能够整体上超越人类分析师。最终的集成模型在2001年至2018年的样本期间,其目标价格预测优于55.9%的IBES分析师。
三、AI分析师的构建方法和表现
(一)预测模型
比较人类分析师和人工智能(AI)在股票预测中表现的模型和方法如下:
1.预测模型的设定:
对于每只股票i在时间t,当分析师做出预测时,记𝐹𝑀𝑎ni,t,j。(其中i,股票; j,分析师;t,预测日期,上标Man表示人类)。将12个月的目标价格预测转换为相应的12个月回报率R𝑀𝑎ni,t,j。预测模型总结为:
2.AI预测与人类预测的比较:
定义Beat为人类分析师相对于AI的指标变量。比较AI预测和其人类对应物基于事后实现的回报率R AI i,t 预测的准确性,AI优于人类的情况定义为:
3.人类分析师相对于AI的表现:
-图 1- AI与人类分析师预测随时间的相对表现
图1展示了AI与人类分析师预测随时间的相对表现。该图绘制了胜率Beat,即每年分析师的价格预测比相应的人工智能价格预测更准确的比例。在2001年至2018年期间,共922,157次预测中,人类分析师在45.5%的时间内优于AI。对于该样本量,从中性概率为一半的分布中提取的百分比的p值小于0.01%。然而,人类分析师的劣势每年都在波动,改善的时间趋势很弱。
(二)各组输入变量对人工智能模型预测的贡献
机器学习的过程往往是不透明的。通过检查不同组输入变量对人工智能模型预测的贡献来减轻不透明性。文章划分这些特征分为六组:基于回报的变量、企业特征、收益(企业和行业)、行业信息、宏观经济变量和从文本信息中提取的变量。通过一次取出一组变量来计算各组的贡献。具体来说,使用所有变量来训练模型,但将排除组的预测因子调整为样本中整个时间的过去平均值。之后,计算预测值的平方误差。然后,计算每年的均方误差,并将其汇总到所有年份。每个变量组的贡献由每个组的均方误差相对于所有组的增量之和的增加来表示。图2绘制了每组特征对AI模型价格预测的贡献。每组特征都对人工智能的能力做出了巨大贡献。宏观变量和公司回报贡献最大(分别为27.6%和24.4%),其次是公司特征变量(22.0%)。来自文本信息的9.3%的贡献凸显了定性信息的重要性,来自收益的信息所占份额最低(2.0%)。
-图2- 变量组对人工智能预测的贡献:留一法
(三)去偏分析师预测(MDM预测)与AI预测的比较
机器的优势可能来自于它处理信息的卓越能力,或者它对由于激励或心理特征而导致的人类预测偏差的免疫(Abarbanell,1991;Stickel,1990)。为了区分这两者,文献将AI预测与“去偏”分析师预测进行比较,在“去偏”分析师预测中,偏差被预测,然后使用机器学习消除(以下称为“机器去偏的人”或“MDM”预测)。
为了解决分析师预测偏差的问题,提出了一种“去偏”分析师预测的方法,即通过机器学习模型对分析师预测进行调整,以消除其预测中的偏差。构建去偏分析师预测(MDM预测)的公式如下:
其中,RMani,j,t表示分析师对股票i在时间t的12个月目标价格转换为的回报率, Ri,j,T(t)是实际的12个月回报率。g(Xi,t-,Zi,j,t-)是一个函数,它包含了所有用于预测目标回报率的变量Xi,t-,以及一组分析师和经纪公司特征变量Zi,j,t-,如分析师的预测偏差、分析师的经验(覆盖公司年数)、分析师的努力(是否提供额外信息如销售或现金流预测)和经纪公司规模等。
该公式通过机器学习模型预测并去除分析师预测中的偏差,形成去偏后的预测(MDM预测)。具体来说,MDM预测是分析师预测 RMani,j,t减去由机器学习模型预测的偏差。通过这种方式来评估在去除预测偏差后,分析师相对于AI的表现。
-图3- 人+机器:机器去偏分析师与AI的表现
图3结果表明,MDM预测在大多数情况下优于原始的AI预测,并且比单独的人类分析师预测更优于AI。具体来说,在2001年至2018年的样本期间,MDM预测在46.5%的情况下优于AI分析师,这比单独的人类分析师(45.5%)高出1个百分点。文献指出,MDM预测的优势主要体现在其能够更好地处理预测中的异常值(outliers),从而提高预测的准确性。通过比较MDM预测与AI预测的误差,发现MDM预测能够将误差减少22.2%(从46.5%-45.5%到50%-45.5%)。通过机器学习模型对分析师预测进行去偏处理,可以显著提高预测的准确性,使其在大多数情况下优于单独的AI预测和人类分析师预测。这种方法不仅能够纠正分析师预测中的偏差,还能够利用机器学习模型的优势,从而实现更准确的预测。
(四)AI与熟练分析师的预测绩效
分析师是一个拥有不同技能水平的庞大群体,因此如果技能是与生俱来的,预测绩效将是持久的。此外,市场通过对相对更熟练的分析师的预测或建议做出更强烈的反应,至少部分地认可了他们(Chen et al.,2005;李,2005;米哈伊尔等人,2007年)。因此,对于AI析师来说,击败熟练分析师的一个更高的障碍。为了评估AI分析师相对于熟练分析师的性能,文献进行了两个测试。第一个测试,根据所有分析师在过去一段时间内的平均预测误差(按股价标准化)将他们分为上半部分和下半部分,长度范围为一年、两年、三年、四年和五年。然后,跟踪他们在每个时间段内击败AI分析师的未来预测的百分比。在第二个测试中,重复相同的程序,除了选择顶级和过去一年、两年、三年、四年和五年中每年的底部分位数。第二个规范对持续技能的要求更高,因为只有大约7.3%的分析师能够在五年内每年保持在前半部分。表2报告了结果。
-表2- AI与熟练分析师预测结果对比
表2中的结果显示,人工智能轻松击败了低技能分位数的分析师。它基本上与更成功的分析师并驾齐驱,几乎与在过去五年中每年表现出色的分析师(分析师胜率为49.3%-50.3%)持平,只有不到十分之一的分析师实现了这一卓越表现。
(五)遵循AI建议的投资组合表现
这一部分讨论了遵循人工智能(AI)建议的投资组合的表现。遵循分析师建议的投资组合的表现是衡量分析师技能的自然指标。出于同样的原因,文献基于AI和人类分析师之间的不同意见来构建投资组合,并评估这些投资组合的表现,以此作为他们相对能力的测试。
投资组合构建方法:每个月,文献收集所有分析师和相应AI在过去30、60、90、180和360天的预测。对于每对预测,如果机器的预测高于上个月机器预测的中位数,而人类的预测低于上个月人类预测的中位数,则定义为买入信号。当两个条件都为负时,定义为卖出信号。在给定的时间期限内,如果买入信号多于卖出信号,则投资组合将做多该股票,否则做空。投资组合每六个月进行价值加权和重新平衡,即头寸持有六个月或直到信号逆转。给出了多空、长腿(仅带有买入标志的股票)和短腿投资组合(仅带有空头标志的股票)的月百分比回报,以及从FF3、FFC4、FF5和FF6模型生成的alpha。
-表3- 遵循AI与人工建议的投资组合表现
投资组合的表现:表3报告了半年度再平衡的多空投资组合的表现,包括平均回报和使用Fama-French三因子、Carhart四因子、Fama-French五因子和Fama-French六因子模型估计的alpha。结果显示,AI模型能够相对于分析师产生更高的回报/alpha,平均每月高出50到72个基点,并且在几乎所有情况下这一结果在统计上是显著的(1%水平)。研究结果表明,AI预测的表现优于分析师共识。当分别考察投资组合的多头和空头部分时,发现AI在多头部分的表现尤为突出,这可能与分析师预测中的正向偏差有关。分析师预测中存在正向偏差,即分析师倾向于过于乐观。这种偏差可能导致分析师的信号在更乐观时变得不那么有信息量,因为AI没有这种正向偏差,所以其信号更具信息量。
(六) “Man + Machine”:人机结合的联合作用
这一部分评估AI与人类分析师结合(即“人机结合”或“Man + Machine”)在股票预测中的性能,并探索这种结合是否能提高预测的准确性。为了评估组合分析能力的性能,文献将分析师预测添加到机器学习模型的信息集中。收集分析师和AI对同一公司在90天窗口期内的预测数据,包括分析师的经验、努力程度、经纪公司特征、预测准确性等。将分析师预测纳入AI模型的信息集,使用集成模型构建“人机结合”的混合分析师模型。评估混合模型相对于单独使用AI或人类分析师模型的性能,使用平均回报和alpha值作为评估指标。
-图4- 人+机器:人工智能辅助分析师与人工智能的表现
图4示出了混合分析师(人+机器)与普通AI(机器)的比较性能。结果表明,混合分析师在57.8%的时间里优于人类分析师,在54.8%的时间里优于单独的人工智能预测。在18年中的15年中,人机结合模型相对于单独的AI模型的优势保持稳定,即使在三个表现接近中性的滞后年份(49.98%、48.28%和47.98%)。 人类分析师的预测包含对AI预测有价值的信息,结合两者的智慧可以进一步提升预测性能。尽管AI的未来仍不确定,但人类分析师在某些方面对AI具有增量价值,这为人类分析师与AI的合作和增强提供了希望,而不是被AI完全取代。
四、人与机器的比较优势
(一)相对绩效的决定因素
在这一节中,文献讨论了人类分析师何时比人工智能表现更好,何时表现不佳。具体内容如下:
估计以下回归模型,以理解人类和AI相对优势的决定因素:
在这个模型中,所涉及主要变量定义如下:
自变量为Relative Performance(相对绩效),其衡量方式包括以下两种,衡量1:Analyst Beats AI:如果分析师的预测误差绝对值小于AI的预测误差绝对值,则该变量为1,否则为0;衡量2:Forecast Error Difference:AI和分析师的预测误差绝对值之差,正值表示分析师的准确性更高。
因变量为X,其衡量方式包括以下几种类型:
信息不对称或不透明度的代理变量,包括Amihud流动性、市值的对数(Log Market Cap)和机构持股比例(% Institutional Holdings);
信息量的变量,包括信息事件数量(Information Events)、公司文件的可读性(Text Complexity)和信息的可理解性(Intangible Assets和Fluidity);
影响分析师可获得的信息和资源的变量,如经纪公司的分析师数量(# Analysts in Brokerage Firm)和明星分析师(Star Analyst);
反映公司财务风险的变量,包括违约距离(Distance to Default)和行业衰退(Industry Recession)。
-表4- 人机对抗:分析师与AI的相对优势
表4结果表明,在控制年度、公司、分析师个体固定效应时,(1)人类分析师在分析流动性差、规模小、无形资产高的企业时表现更好,因为这些企业信息不对称性更高,需要更深入的机构知识;(2)对于披露信息量较大的公司,AI表现更好,# Information Events每增加一个标准差,人类胜率就会下降1.8%;(3)大型经纪公司的分析师表现更好,可能因为资源和研究能力更丰富,且分析师技能与公司声誉匹配;(4)人类分析师在企业面临更高财务困境风险时表现更好,而AI在处理不确定性方面存在困难;(5)人类分析师在机构持股比例高的企业中表现更好,可能因为他们更熟悉机构投资者的信息;(6)不考虑年度固定效应时,人类分析师的优势随时间增加,可能是由于AI和大数据技术的帮助;(7) 明星分析师的表现并未显著优于AI,表明其能力可能被机器复制。
同时文献将投资组合回报分析扩展到根据四个公司特征变量排序的子样本,这些变量预计与人与机器的相对绩效相关:流动性、无形性、信息事件数量(大量信息)和违约距离。结果表明,当企业拥有更少的无形资产、更多的信息并且远离违约时,投资组合绩效更有利于人工智能模型。
(二)人机分歧
这一节讨论了人类分析师和机器AI在预测方面的差异(Disagreement),并分析了这种分歧与公司和分析师属性及经济条件之间的关系。主要内容包括:
-图5-人机分歧
图5展示了分析师和AI预测回报之间的平均平方差年度时间序列。分歧被定义为分析师和人工智能预测的回报之间的平方差。每年,计算分歧的平均值。中间的蓝线给出了这个平均分歧。研究发现,人类与机器的分歧总体上呈下降趋势,这可能是因为分析师越来越多地利用大数据和AI工具。
研究进一步考察了在人类和机器分歧较大时的相对表现,理解这种情况对于AI引导的决策(包括投资)具有重要意义。对于每对预测,如果分析师和AI模型之间的分歧大小(通过这两个预测误差的最大值归一化)高于三年内对同一公司的所有预测中的第90百分位,分歧(Disagreement)定义1。以存在分歧为条件,进一步定义了一个子指标“Human Wins”,当人类预测误差绝对值小于机器时,该指标为1。回归结果如表5所示。
-表5- 人机分歧
表5的第(1)列和第(2)列分别考察了分歧的发生与公司和分析师属性及经济条件之间的关系,结果表明,流动性差、信息不太丰富的无形企业往往会出现很大的分歧,这是与人类比较优势相关的企业特征。(3)和(4)列关注有分歧的子样本,并检查人类何时获胜,结果证实,如果双方意见不一致,同一组特征也与人类获胜有关。上述模式的一个例外是# Analysts in Brokerage Firm。大型券商的分析师不太可能不同意AI的观点。然而,如果存在较大分歧,这些分析师也更有可能击败机器。
五、人机结合:增量贡献与协同效应
(一)增量价值和人机协同效应
这一节主要探讨了人类与机器结合("Man + Machine")在股票分析中的影响。与上一节类似,该部分定义了混合分析师与人工智能的相对性能指标,以捕捉人类的增量价值。然后以这些相对绩效指标作为因变量重新估计等式(3)。表6显示了结果。
-表6- 人机协同的增量价值
-表7- M+M对人或机器的增量影响
之前的发现表明,文献发现当分析师的预测加入机器学习模型时,形成的混合模型("Man + Machine")在54.8%的情况下优于仅使用AI模型的预测。这种混合模型在15个年份中表现优于纯AI模型,表明分析师的输入对AI模型有显著的增量价值。进一步分析表明,这种增量价值在处理流动性差、无形资产多、面临更高风险的公司时更为显著。分析师的增量价值并不会随着信息量的增加而减少,这与单独工作的人类分析师不同。
(二)"Man + Machine"可以避免极端错误吗?
极端错误可能对预测者声誉或投资建议接受者的福利造成灾难性影响。该部分探讨了"Man + Machine"模型在避免极端错误方面的能力。主要内容如下:
文献定义了四种可能的结果来评估谁犯了极端错误:(1)人类分析师和AI模型都犯了极端错误(Both);(2)只有人类分析师犯了极端错误(Analyst)。(3)只有AI犯了极端错误(AI);(4)两者都没有犯极端错误(Neither)。计算了这些情况的发生频率,并进一步计算了“人类+机器”模型能够避免前三种情况下极端错误的无条件和条件概率,以及“人类+机器”模型在第四种情况下造成极端错误的概率。表8报告了结果。
-表8- 极端错误的概率报告
表8结果表明,分析师和AI模型都有犯极端错误的倾向,但"Man + Machine"模型能够避免90.7%的人类错误和43.6%的AI错误。即使在分析师和AI都出错的情况下,"Man + Machine"模型仍能将4.6%的情况带回合理范围。这种模型在避免极端错误方面表现出显著的互补优势,这对于高风险场景下的应用尤为重要。
(三)人机结合的影响:事件研究
在这一部分,通过事件研究方法,文献评估了人类与机器结合在股票分析中的影响。研究基于"big data"基础设施产生的新信息,特别是卫星图像等替代数据,这些数据需要通过机器学习模型处理。基于替代数据的逐步引入,对分析师的表现与AI模型进行了DID测试。基础前提是,覆盖替代数据的分析师可能处于“Man + Machine”的实际情况,因为他们有机会使用额外的AI处理信息。文献选取了这一shock,估计了以下DID模型,表9报告了结果。
-表9- 事件研究:替代数据覆盖
表9结果表明,在使用替代数据后,覆盖受影响公司的分析师相对于人工智能模型提高了他们的绩效,但只有在与人工智能招聘互动时才显著提高。换句话说,预测性能的提高集中在与拥有强大AI能力的经纪公司合作的分析师子集中。总体结果表明,用新技术增强人类是分析师职业的一个有前途的方向。
六、研究结论
文献通过构建一个AI分析师模型,研究了股票分析中人类分析师与AI之间的竞争与协作关系。研究发现,在2001年至2018年的样本期间,AI分析师在54.5%的股票回报预测中优于人类分析师,其优势在于强大的信息处理能力和对大量透明信息的处理能力。然而,人类分析师在处理信息不对称较高、无形资产较多或面临高流动性风险的公司时表现更好。此外,研究还发现,当人类分析师获得替代数据和内部AI资源时,其预测能力显著提升,尤其是在与AI协作时。这表明,在高技能职业中,“人机协同”能够产生更高的预测准确性。总体而言,这项研究支持人工智能可以增强分析师能力的假设,更重要的是,分析师的工作对人工智能建模具有增量价值和协同作用,特别是在不寻常和快速发展的情况下。这一独特的发现对人工智能助手的安全性具有重要意义,同时保留了人类在决策中的关键作用。该研究结论为人类如何利用自己的优势并更好地适应人工智能时代提供了指导。
Abstract:
An AI analyst trained to digest corporate disclosures, industry trends, and macroeconomic indicators surpasses most analysts in stock return predictions. Nevertheless, humans win ‘‘Man vs. Machine’’ when institutional knowledge is crucial, e.g., involving intangible assets and financial distress. AI wins when information is transparent but voluminous. Humans provide significant incremental value in ‘‘Man + Machine’’, which also substantially reduces extreme errors. Analysts catch up with machines after ‘‘alternative data’’ become available if their employers build AI capabilities. Documented synergies between humans and machines inform how humans can leverage their advantage for better adaptation to the growing AI prowess.