Eye in the sky: Private satellites and government macro data
天空之眼:私人卫星和政府宏观数据
原文来源:Mukherjee A,Panayotov G,Shon J. 2021. “Eye in the sky: Private satellites and government macro data”. Journal of Financial Economics.141(1):234-254.
编者按:文章基于商业卫星的宏观估计,研究技术进步是否可以提供一种替代政府数据的替代方法,利用卫星估计对资产价格的影响来衡量卫星估计对政府宏观公告价值的影响程度,通过识别云层覆盖阻止了卫星在几个关键中心的经济活动,发现卫星估计的有效程度使得市场不再对政府的公告作出反应。研究结果表明,未来宏观不确定性的解决更加顺利,政府对宏观信息的控制更少。
一、研究背景
从历史上看,市场一直依赖于政府的公告来获取宏观信息,这种依赖可以追溯到私人实体为提供汇总数据所必须产生的高昂成本。
首先,这种宏观信息也被用来衡量政府的经济表现,因而产生了利益冲突。各个国家的宏观数据经常受到怀疑,尤其在美国等许多发达经济体中,由于党派关系差异很大,对政府数据的信任远非绝对。当今世界,“假经济数据 ”与“假新闻”的威胁的出现更强调了可信度的重要性,这类数据可信度问题甚至超出了经济范围,例如对最近冠状病毒爆发的应对受到了各国公共卫生数据完整性的影响。
其次,政府数据的公布次数很少,而且经常会出现滞后。在目前的模式下,宏观不确定性通常会在政府公告日的大幅决议之前的时期形成。这种波动反映在资产价格上,特别是超过60%的累积年度股票风险溢价是在宏观公告日获得的(Savor and Wilson, 2014)。因此这个阶段往往与价格的大幅上涨有关,反映出被压抑的宏观不确定性。
文章开发了一种方法来确定卫星图像的改进是否正在改变市场获取宏观信息的方式。为了评估基于卫星的估计对某一特定政府宏观公告价值的影响,文章以美国原油和中国制造业为例,比较了该公告在多云和晴天的资产价格,表明这种估计极大地改变了这两种情况下市场对政府宏观数据的依赖。
文章的目标是提出一种方法来理解基于卫星的估计/预测的有效性,证明替代数据对金融市场和其他领域的一些影响。对美国原油的证据表明,基于卫星的库存估计导致美国原油市场隐含波动率降低和价格上涨,市场解决宏观经济不确定性的方式发生了转变。对中国制造业的证据表明,在这个投资者并不总是相信官方声明的国家,对政府宏观数据的依赖发生了转变。
二、相关文献
(一)卫星图像作为经济研究的数据来源的优势
Donaldson和Storeygard(2016)证实卫星图像作为经济研究的数据来源的优势在于广泛的地理覆盖范围、获取其他方面无法获得的信息和高空间分辨率。Henderson et al.(2012)、Saiz(2010)、Michalopoulos和Papaioannou(2013)将卫星数据用来衡量总体经济活动或土地使用情况。Foster和Rosenzweig(2003)、Burchfield et al.(2006)、Burgess et al.(2012)、Holmes 和Lee(2012)将卫星数据用来监测污染、农业、土地、农作物、电力使用或森林砍伐。Hansman et al.(2019)将卫星数据用来研究气候和天气的经济影响。Zhu(2019)研究了轨道洞察(OI)的销售预测,该预测使用基于卫星的停车场交通估计,以及这些预测作为这些公司的约束机制的作用。Katona et al.(2019)还研究了卫星数据使用对股票交易和股票市场信息不对称的影响。
(二)市场对宏观公告的反应
Bernanke和Kuttner(2005)、Andersen et al.(2007)、Savor and Wilson(2013, 2014)、Gilbert et al.(2017)侧重于研究市场对宏观公告的反应;Roache和Rossi(2010)、Elder et al. (2012)、Halova et al. (2014)、Caporale et al. (2017)研究了宏观公告对大宗商品价格的影响;Bai et al.(2013)、Baum et al.(2015)研究了中国政府债券市场的微观结构和中国的宏观公告影响。
(三)宏观经济和石油市场之间各种联系
Hamilton(1983)、Hamilton(1996)、Kilian和Vega(2011)研究了宏观经济和石油市场之间的各种联系;Hong和Stein(1999)、Hong et al.(2007)、Hong和Yogo(2012)在商品市场的背景下研究了宏观经济和石油市场之间的一般金融市场信息扩散。
(四)金融背景下天气的数据应用
Hirshleifer和Shumway(2003)、 Goetzmann et al.(2015)研究了资产交易与天气诱发的交易员情绪波动之间存在的关联。
三、概念框架
(一)衡量政府宏观信息的价值
文章考虑到政府并不是宏观信息的唯一来源,不同的市场参与者可以接触到不同片段的此类信息并可能在金融市场上进行交易,这种集体交易活动可以将宏观信息存储到资产价格中而不需要政府聚合,诸如个别代理、分析师、交易员、机构投资者,基于这些估计的投机性交易也可能将这些来源的信息纳入相关资产的价格。因此,衡量基于卫星的估计如何改变政府信息价值的一种简单方法是检查资产价格的影响在多大程度上取决于高质量卫星图像的可用性。
(二)枢纽和瓶颈在估计宏观数量中的作用
宏观估算主要的问题源于信息收集活动的规模,这通常即使是大型私人实体企业也无法触及的范围,比如政府通过人口普查收集整个经济的信息,公民或公司被法律要求向政府如实披露信息,政府还可以获得税务记录等直接的信息来源。
但是,宏观估算没有必要监控整个经济来估计宏观数量,仅仅关注衡量关键生产中心或供应链瓶颈的经济活动就已足够。这种方法通过对该估计的准确性进行随机变化,例如,通过随机关闭和切换在估计过程中使用的数据的可用性,更容易确定一个特定的宏观估计对某些特定变量的因果效应。如果这些中心对被估计的活动至关重要,那么它们的可观测性的随机变化可能会产生估计质量的差异足以用于识别的目的。文章对此选取了美国俄克拉荷马州库欣等地WTI(西德克萨斯中质原油)原油的集中储存,以及中国四个省份(广东、江苏、浙江、山东)的制造业活动集中。
(三)云作为识别工具
卫星估算的问题在于在一些基于卫星的估计数出现后,仅仅表明资产价格围绕某些政府公告的波动减少是不够的。首先,这样的结果可能是由于其他同时期的市场发展,比如政府在此特别公告之前开始向市场提供其他相关信息。其次,基于卫星估计的出现是内生的,这可能是由于对某一特定资产信息的需求发生了变化,促使替代数据覆盖,但同时促使分析师不使用卫星数据提供更高质量的预测,即价格影响的变化可以由这些更好的分析师预测来驱动,而不是替代数据的可用性。最后,基于卫星的估计或对特定宏观变量的预测的出现也反映了卫星数据提供者选择覆盖某个特定变量而不是其他变量。
文章对此将某一特定宏观声明的价格影响与中心的云覆盖联系起来,来识别基于卫星的估计的有效性。在天空晴朗的情况下,当卫星能够观察到这些关键中心的经济活动时,市场在政府宣布之前就会了解宏观状况,因此对价格的影响很小。在天空多云的情况下,基于卫星的估计不太可能事先提供精确的信息,市场必须等待该公告来解决任何不确定性,从而导致更大的价格影响。如果基于卫星的估计是无效的,那么无论是否估算可用,公告的价格影响都应该是相同的。综上,如果目标宏观公告的价格影响在多云和晴朗的时期有所不同,那么基于卫星的估计是有效的。
四、美国的卫星和原油库存
(一)样本数据
文章样本的基期为2014年1月至2018年12月,研究的关键在于选择石油储存枢纽来测量云覆盖。一方面这些地点应充分代表总体石油库存,以便基于这些地点的衡量标准能够与石油市场总量、石油价格相关;另一方面应该限制这些地点的数量,以避免这些地点的本地云量在某种程度上直接影响美国石油的总体需求或供应的可能性。因此,文章基于5个美国国防区石油管理局(US PADD),选取PADD 2和3中有10个与多个管道相交的关键点从而构建每周云量测量方法。如图1所示,在样本期间,这十个地点的存储设施约占美国总数的三分之一。
图1 美国国防区石油管理局和主要的储油地点
文章每周的原油库存数据来自美国政府能源信息管理局(EIA),接受调查的公司总共至少占美国石油库存总量的90%。这些公司报告截至上周五7点的库存数据,EIA汇总答复后,通常在下个周三上午10:30之后即五天后在其石油状态报告中公布结果。如果周一、周二或周三有假期,该周的公告将推迟到周四或周五上午11点,文章将相应调整相应的油价和云数据。
文章的云覆盖数据来自国家海洋和大气管理局(NOAA)提供的综合地表数据库(ISD)的气候数据,每小时从离十个存储位置最近的机场收集云覆盖数据并且平均所有白天的云覆盖量。同时,晴朗周被定义为在测量日(周五)和下一个周三的公告之间至少有一天是明确的情况,多云周被定义为多云周应定义为在测量日和公告日之间,一周最少多云的时间超过某一阈值,即样本的第75百分位。
文章的WTI原油期货价格数据来自汤森路透蜱虫历史数据库、基于卫星的每周石油库存估算的专有数据以及芝加哥期权交易所(CBOE)的原油隐含波动率OVX指数。
表1显示了美国云度测量值、石油库存、石油回报及其选择隐含方差的汇总统计数据,以及所使用的主要轨道洞察力(OI)变量。石油回报以零为中心但平均略负,反映了样本期间库存略有增加的总体趋势;OI估计的平均库存数字为4.356亿桶,标准差为4660万桶,略小于EIA估计的5760万桶的波动率;OI的估计的平均(绝对)误差为2600万桶,是EIA库存数量的标准偏差的0.45倍。
表1 美国石油市场的汇总统计数据
(二)模型设计
模型:为评估环评公告在多云及晴朗周的价格影响,文章进行以下类型的回归。
变量定义:rett表示t时刻的原油期货收益,根据近月WTI期货合约计算并以百分比表示。△Oil_Invt是石油库存的(意外)变化,如第t天宣布的,按单位标准差计算,以方便解释系数βclear和βcloudy。Cloudyt是一个虚拟变量,在多云的一周内的值为1,定义为当我们的云量变量超过其在样本中的第75百分位时的一周。Cleart等于1减去Cloudyt。为了避免分布假设,我们报告了自举p值。
(三)回归结果
表2显示了OLS的回归结果。βclear和βcloudy估计为负,反映了过剩供应(较大的库存)和油价之间的负相关关系。因为Oil_Invt按比例计算,则两者可以分别解释为在晴朗和多云周每一个标准差意外减少的平均回报比例。其中,βclear与晴朗周相关的估计数都很小(0.05到0.1之间),在所有情况下统计上都不显著,表明EIA的公告在清晰的几周内几乎对油价没有影响,这意味着公告中所包含的信息已经反映在油价中。βcloudy与多云周相关的估计数的数量级是前者的5到10倍,并且在所有情况下的1%置信水平上都很显著。综上,文章证据表明,与多云周不同,晴朗的周与EIA的公告有关,而近年来对油价的影响几乎没有影响。
表2 石油期货收益的回归结果
(四)安慰剂检验
表3显示了油价在其他时候受到影响波动的安慰剂测试。顶部面板表明在早期(2007-2011年),测试中使用的高频石油期货价格数据在2007年之前缺失;中间面板表明如果将表2的返回范围移两个小时,使它们不再横跨公告,得到的多云周的斜率系数估计值平均要小得多,而且在统计上不显著;底部面板显示了基期间所有非公告天数的总和的结果,但统计结果变化幅度较小且缺乏经济意义。
表3 安慰剂检验
(五)基于卫星的石油库存估计数的机制分析
文章收集OI——一家基于卫星图像的石油市场信息的主要供应商的每日数据,直接评估云对基于卫星估计的石油库存的准确性的影响。这些数据包含了其库存估计的抽样误差,反映了储油罐可观测性的稳定性。
表4结果显示样本误差的斜率估计为0.31,表明十个中心完全多云的一天相对于完全晴朗的一天,OI的抽样误差增加了72.9%。OI估计误差的斜率估计为9.82,平均估计误差为5.71,两者都以百分比测量(OI的估计值与真实值之间的绝对百分比差值),从完全晴朗到完全多云的天空OI的估计误差增加了172.0%。两列中经济大小的差异表明,当云模糊了主要储油中心的视野时,OI估计的误差不成比例地增加超过相应的油箱采样误差的下降,这种差异与关键存储中心的可见性对于估计总石油库存尤为重要的观点一致。综上,云量测量和储油罐的可观测性之间存在经济上的关系。
表4 轨道洞察力对云量的估计误差的回归结果
(六)基于石油隐含波动率的机制分析
文章通过从OVX波动率指数中获得的隐含石油收益率方差,研究几个枢纽上方云量与美国石油市场不确定性解决之间的关系。此处假设如果市场能在某一特定日期“看到”库存水平,那么直到未来某一特定日期的不确定性(未来一个月的隐含石油差异中)应该会更低。文章将一个常数和一个日云量虚拟变量作为解释变量,对隐含石油方差进行回归。此处回归的是前一天测量的云量的隐含方差:昨天的云量影响了当天估计的准确性,从而到达市场影响今天的不确定性分辨率。
表5结果显示,在基期间,隐含石油方差在多云天气平均为14.3%,在晴朗天气平均为12.8%,差异为平均方差的10.5%,p值为0.02,与假设一致且显著。2007-2011年多云和晴朗天气的隐含方差差异为平均水平的0.8%,p值为0.82,在统计上不显著。因此在这一时期,如果云确实只通过它们对卫星所能看到的东西的影响来影响不确定性,那么预计将不会发现云和方差之间的关系,从反向证明了原假设。
表5 石油收益率方差的回归结果
(七)基于油价反应的机制分析
文章假设,在多云的几周内,市场必须等到EIA公告后才能了解石油库存,但在晴朗的几周内,这些信息将在通过卫星估计宣布之前被纳入油价。由于卫星只有在能够“看到”石油库存水平的情况下才能通知市场,在卫星观测库存后,通常需要基于卫星的估计提供者花几个小时来处理和共享他们的数据,这样t-1时刻的基于卫星的估计将在第二天t时刻发布。因此,在晴朗的一周内,大部分的意外公告应该在第一个晴天的第二天纳入油价。
文章用index j,t表示t周的第j天,构造一个虚拟变量Firstclear j,t(Other j,t),如果day i,t前的一天是t周的第一个晴天,取值为1,否则为0。将意外的石油库存变化与以上虚拟变量作为解释变量,对每日的石油回报进行回归,结果如表6所示。
表6结果显示,在基期一周中的所有天数中,β1st clear是βother的四倍,意外公告和当天的石油回报之间相对于一周中的所有其他日子具有更强的联系,与FirstClear j,t相互作用的系数更大,即使删除公告天数结果依然稳健。在前期一周中的所有天数中,β1st clear和βother都接近于零,在统计上几乎没有意义,意味着由于当时基于卫星的估计并不那么普遍,在EIA宣布价格之前,即使是在清晰的几周内也没有信息泄露到价格中。
表6 透明周每日石油回报的回归结果
(八)基于油价上涨的机制分析
文章假设由于卫星更频繁地提供有关石油市场状况的信息,在多云周(缺乏高质量的卫星估算)的价格上涨将比在晴朗周(卫星能够提供准确的估算)更大。为了验证价格波动,文章采用Lee和Mykland(2008)的一种非参数方法,测试每个回报区间内的跳跃,通过标准化回报来解释瞬时波动,使用5%和10%的置信水平来检测每周的跳跃,并计算这些跳跃的平均大小,没有任何跳跃的周赋值为0,将晴朗周和多云周的虚拟变量对周跳跃幅度的总和进行回归。
表7结果显示,在基期间,当使用5%(10%)的置信水平时,βcloudy比βclear高25%(29%),p值分别为0.09和0.03,差异具有统计学意义。在前期,βcloudy和βclear之间的差值无显著性差异。因此,由于云层的原因,卫星无法观测到石油储存中心时,石油市场信息更有可能出现更大的跳跃。
表7 非参数跳跃检测测试的结果
五、中国的卫星和制造业
(一)样本数据
文章评估了政府每月公布PMI对中国主要股价指数的影响,因为PMI公告被认为是有关中国宏观经济趋势的一般信息,从而对整体股市产生影响。文章从中国物流与采购联合会(CFLP)收集PMI数据,检查上海和深圳证券交易所交易的300只最大的股票的价值加权指数(CSI300)。由于PMI将在上午9点左右公布,所以测量CSI300前一个交易日接近10:00,10:30,11:00和11:30的回报以确保我们的回报期包括公告,时间上将2014-2018年作为基期,2009-2013年作为前期,保持与美国石油市场的长度相同。
文章的云覆盖变量使用来自NOAA的天气数据,以四个制造业中心为重点,选择江苏的南京和溧阳,浙江的杭州和金华,山东的烟台和青岛,广东的肇庆和广州,同时将上海和深圳排除在名单之外,并对选定的8个城市测量每个月的每日云量,最后使用由SpaceKnow提供的基于卫星的PMI估计数(SMI),来建立我们的云覆盖仪器的有效性。
表8显示了云覆盖量、PMI、CSI300指数回报、SMI的汇总统计数据,表明在2014年至2018年期间,PMI与工业扩张相关(平均水平为50.69),SMI估计的绝对误差(0.82)与PMI标准差(0.7)的比率为1.04。
表8 中国股市指数和PMI的汇总统计数据
(二)模型设计
模型:
变量定义:rett表示第t天的PMI指数回报(以百分比计),t是PMI公告日。PMIt是PMI的意外组成部分(按单位标准偏差计算),Cleart和Cloudyt为虚拟变量,当第t天公布的PMI与晴朗(多云)月份相关联时为1,否则为零。
(三)回归结果
表9回归结果如下,顶部面板显示了CSI300股票回报数据对PMI的意外成分与虚拟变量交互的回归结果。平均而言,PMI指数意外高企导致市场产生积极反应,这种反应在多云月份约是在晴朗月份的两倍,且仅在多云月份显著。底部面板选择了PMI敏感性最高的100只股票,在每次PMI公告的前一天,利用这100只股票构建一个价值加权投资组合取代了CSI300指数进行回归,且按市值减少了底部三分之一的股票以确保数据质量和避免微观结构噪声问题。对于对pmi敏感的投资组合,其中有两个回报水平中差异在10%水平上显著。
表9 中国CSI300股市指数回归结果
(四)安慰剂测试
表10结果如下,顶部面板显示前期(2009-2013年)对晴朗和多云月份的价格影响几乎没有差异,βclear和βcloudy系数的估计值相似,并且在所有情况下,这些差异的p值都超过0.70。虽然系数估计在许多规范中统计上不显著,至少对于整个返回间隔(在上午11:30结束),但两个系数估计在10%置信水平上都是显著的。中间面板显示了基期从13:00 p开始到一天的结束的PMI公告日衡量的CSI300收益,但无论是晴天还是阴天,这些回报在经济上和统计上都几乎没有意义。底部面板显示了类似的小幅度的估计和非公告日,此处PMI公告一周的工作日不包括实际的公告日。
表 10 安慰剂测试
(五)机制分析
表11基于在一个常数和云量测量上对SMI估计的误差进行的回归,误差计算为SMI和实际的PMI之间的绝对百分比差。结果显示从完全晴朗到完全多云的月份,SMI的误差增加了262.4%(斜率系数为4.25%,SMI估计的平均误差为1.62%),表明平均云度测量有足够证据检测在晴朗和多云的月份SMI误差的差异。
表11 SMI估计误差的回归结果
表12基于CSI300指数中云度和价格上涨之间的相互作用,由于PMI在每月初发布,不确定性随着时间的推移而增加,更多未解决的不确定性应该在一个月底积累,使得在统计学上更容易检测到接近月底的更大的跳跃。结果显示,在基期间,晴朗月份的平均跳跃幅度约为0.7%,明显小于多云月份的约1.2%。在前期,晴朗月份和多云月份之间的差异至少要小三倍,即差异不明显。
表12 非参数跳跃检测测试的结果
六、研究结论
文章的动机是最近基于替代数据和市场参与者使用的各种估计的可用性的增长,主要问题是基于卫星的宏观经济变量的估计信息是否在政府宣布任何之前有助于解决宏观不确定性。步骤如下:首先,文章通过其价格影响来衡量政府宏观公告的价值。其次,文章关注的是几个对估计特定宏观变量特别重要的地点。第三,文章使用这些位置上的本地云覆盖作为一种工具,自然地提供卫星数据质量的随机变化。结果表明,当枢纽天空主要是多云时,基于卫星的估计确实不太准确,误差明显更高;各自的政府公告的价格影响更大,且在统计上显著;宏观不确定性的解决率更小,从而导致更大的价格跳跃。但是,基于卫星的估计能取代政府作为一个宏观经济信息的提供者这个问题,仍有待未来研究进行更深入的探索。
原文地址:https://libcon.zuel.edu.cn/piswww.sciencedirect.com/science/article/pii/S0304405X21000921
ABSTRACT
We develop an approach to identify whether recent technological advancements—such as the rise of commercial satellite-based macro estimates—can provide an alternative to government data. We measure the extent to which satellite estimates affect the value of a government macro announcement using its asset price impact. Our identification relies on cloud cover, which prevents satellites from observing economic activity at a few key hubs. Applying our approach, we find that some satellite estimates are now so effective that markets are no longer surprised by government announcements. Our results point to a future in which the resolution of macro uncertainty is smoother and governments have less control over macro information.