人工智能征服了金融市场,但它却输给了加密货币

原创

2019-08-13 21:41:15

1031

532

1

655

2010年春天,剑桥大学的数学博士詹姆斯 · 泰勒在华尔街一间毫无特色的办公室里研究他的一些自动交易算法的行为。

泰勒一直在对市场事件进行模拟,以判断自己的算法交易程序的响应时间,他开始担心,在某些市场条件下,算法可能会标记出错误信号,导致反馈回路,从而对他工作的基金产生意想不到的灾难性影响。

泰勒工作的高频交易基金(HFT)是集中在华尔街纽约证券交易所(NYSE)周围的众多高频交易基金之一,通过减少交易订单通过高速光纤电缆到达纽约证券交易所所需的时间,获得了纳秒级的优势。

泰勒是他的高频交易基金的首席风险官,他的工作就是监控利用市场数据进行高速交易的算法,在每笔交易中倒卖基点,为基金的投资者带来利润。

但在2010年春天,汤彦麟发现了表面上看似不相关的算法之间的相互依赖关系。这种算法有可能创造一个自我延续的市场信号反馈循环,导致大量抛售订单涌入市场,尽管除此之外没有卖出某种特定证券的根本原因。

另外,由于汤彦麟使用的许多算法都依赖于交易员所说的“技术”指标,即价格、交易量和交易规模等客观市场数据,在某些市场“触发”下,该基金的许多自动交易程序只需快速连续执行卖单,以保护该基金的投资组合。

换句话说,如果一个算法“发现”一个卖出指令正在发出,它也会自动发出一个“卖出”指令,但这个随之而来的“卖出”指令也会触发另一个算法发出另一个“卖出”指令,等等,直到这些程序导致市场崩溃。

尽管 HFT 策略向监管机构保证,此类事件发生的可能性接近于零,但2010年春季的闪电崩盘(Flash Crash)正是如此。

2010年5月6日,纽约一个阳光明媚的下午,从下午2点32分开始,标准普尔500指数、道琼斯工业平均指数普尔500指数和纳斯达克综合指数普尔500指数在36分钟内崩盘反弹,引发心脏病发作。

道琼斯工业平均指数经历了历史上第二大盘中点数下跌(自开盘以来) ,在几分钟内暴跌近1000点(约9%) ,随后迅速反弹,弥补了大部分损失。

尽管“闪电暴跌”的真正原因至今仍有争议,但美国司法部(DOJ)将大部分责任归咎于纳文德尔•辛格•萨劳(Navinder Singh Sarao) ,这位36岁的三流交易员在其父母位于伦敦西郊的普通灰泥房子里工作。

美国商品期货交易委员会(CFTC)的调查显示,萨劳“至少对衍生品市场的订单失衡负有重大责任” ,这种失衡影响了股市,加剧了闪电暴跌。

早在2009年,萨劳就开始利用商用交易软件进行所谓的市场操纵,他对代码进行了修改,“以便能够迅速下订单并自动取消订单。”

根据司法部的起诉书,Sarao 下了大约“2亿美元的赌注” ,在最终被取消之前替换或修改了大约19000次。

Sarao 当时使用的一些做法是完全合法的,包括欺骗(在交易所输入并迅速取消大量买入或卖出订单,以制造对市场状况的错误印象)、分层(类似于欺骗,分层是 HFT 策略,即交易员制定并取消他们从未打算执行的订单,以期影响价格)以及提前交易(预先交易、非公开信息,因为知道这些信息将影响证券价格)——这些策略后来被禁止。

但是,萨劳的命令并不大。在一个每天交易数万亿美元的市场上,2亿美元仅够移动指针。

一些分析师认为,闪电崩盘的真正原因是算法交易程序捕捉到的错误信号,这些程序会自动扫描市场,然后根据这些信号自主行动。

这就是为什么会有一系列抛售订单,导致市场崩盘,随之而来的是市场已经超卖的信号,导致了一系列的买入订单,使市场恢复到最初的均衡状态。

2010年金融市场的教训(以及随后2015年的闪电崩盘)也可能为上周发生的比特币价格提供一些教训。

比特币交易的自动化程度远超预期

今年年初,比特币交易一直在一个相对较窄的区间内(以比特币标准衡量,这个区间很窄) ,在3000美元至4000美元之间波动。

当比特币在2月底突破4000美元时,这种反弹是短暂的,因为加密货币市场的自动交易在24小时后迅速将比特币价格拉低到4000美元以下。

在整个期间,比特币的交易量相对稳定,主要由做市机器人和其他算法交易程序组成,这些程序将比特币的交易量保持在一个或多或少的均衡区域内。

然而到了四月底,情况发生了戏剧性的变化。

所有加密货币交易所的比特币交易量都增加了一倍以上。这一系列活动的增加改变了比特币的交易区间,在4000美元至5500美元之间,这一水平一直持续到4月底。

大约就在这个时候,2019年4月24日的法庭文件显示,纽约总检察长正在对 Bitfinex 提起诉讼,指控他滥用 Tether 的资金,以弥补在加密货币交易所造成的约8.5亿美元的损失。

Bitfinex 可能存在渎职行为的消息,非但没有抑制比特币的价格,反而给这种全球市值最大的加密货币注入了一针强心剂,在接下来的几周里,比特币的价格远远超过了6000美元。

在交易量显著增加的背景下,自动交易程序开始运行,利用市场信号,推高比特币的价格。

来自自动交易程序和人工交易者的交易量增加的信号,导致更多的自动交易程序被激活,到5月中旬,比特币交易量是1月份的8倍。

由于创建了反馈循环,自动交易程序在人类交易员的支持下继续推动比特币走得更远,一路超过了7000美元,这是自2018年中期以来的最高水平。

随着比特币开始测试8000美元的水平,这是自动交易程序开始退出比特币头寸的足够信号,几乎在一夜之间,比特币在交易量巨大的背景下跌回7000美元的水平。

随着交易量开始稳定,比特币再次进入交易区间,在5月底达到8000美元。

但在5月的最后几天,比特币在过去几周多次测试了8000美元的关卡,突破了8000美元的关卡,导致一些人声称“加密的冬天”终于结束了。

但是,庆祝比特币的春天解冻可能还为时过早,因为自动交易将使比特币再次保持在8000美元至9000美元之间的区间内,实际上从未触及9000美元的水平,也从未突破。

这些信号足以使自动交易程序陷入混乱,随后在6月第一周,比特币跌破8000美元,继续徘徊在7500美元至8000美元的区间内。

自动化就像自动化一样

与金融市场不同,加密货币市场是全天候运行的,由于能够达到这种水平的业绩和集中度的人力交易员寥寥无几,因此大部分加密货币交易都是通过自动交易程序进行的。

不过,与金融市场不同的是,在任何主要的加密货币交易所上,高频交易都是不可能的——为了避免交易所本身崩溃,有意对利率进行了限制。

然而,在分散的交易所(以及一些集中的交易所) ,许多金融市场禁止的行为不仅明显,而且普遍存在。

在加密货币交换中,诸如前置、欺骗和分层等行为都很常见。

在加密货币市场,大部分交易已经高度自动化,这种操纵意味着自动交易程序消耗和响应的数据质量极易受到反馈循环的影响。

但与金融市场不同的是,由于缺乏高频交易,这些反馈循环需要更长时间才能显现出来。

因此,尽管加密货币市场可能不会出现受监管的金融市场面临的闪电崩盘风险,但加密货币市场仍然容易受到定义自动化市场行为的错误的、自我延续的反馈循环的影响。

交易机器人检测增加的数量,激活新的交易程序,检测增加的数量等等。

但我们期待的是什么呢?

因为我们已经习惯了人工智能或人工智能自动填充搜索领域,推荐我们买书或穿衣服,看我们的脸,(最终)驾驶我们的汽车,我们已经开始期待很多从技术。

但如果说人工智能还有一个领域需要征服的话,那就是金融市场。到目前为止,计算机化的选股人或投资机器人还没有一直比金融市场更聪明,但这并不是因为缺乏尝试。

在80年代中期,一些最聪明的技术人才齐心协力地推动,科学地建立市场模型,而不是说,找到治疗癌症的方法。

许多人为制造终极交易机器人所付出的努力吸引了数学、计算机科学、甚至火箭推进等领域的一些顶尖毕业生。

像文艺复兴科技公司、 D.E.Shaw 和 PDT Partners 这样行事隐秘的对冲基金在20世纪下半叶大举进行交易,创造了超额回报。

许多“机器人”对冲基金凭借其“黑匣子”能够获得超额回报,部分原因在于当时的计算技术状况。

在计算机运行相对缓慢(按照今天的标准)、信息传输速度不快或不那么自由的时期,早期的算法交易机构能够在比今天更长的时间内更好地发现、保存和利用有利可图的交易策略。


但是随着计算机的发展和互联网的出现,曾经有利可图的投资策略,经常超过30% 的年回报率,现在已经不能达到以前的水平。

顶级定量基金,如詹姆斯•西蒙(James Simon)的复兴科技(Renaissance Technologies) ,调整了自己的算法。可以肯定的是,西蒙的交易策略从来都不是纯粹由算法驱动的,而是以公平的方式衡量人为的监督和判断力,以及。

事实证明,投资并不像试图预测你在亚马逊的下一次购买。.”“这是应用机器学习中最困难的问题之一。”

由于同样的原因,自动驾驶汽车有一个趋势,最终在车祸,人工智能驱动的投资也有一个趋势,导致闪电崩溃。

别动,否则我就开枪了

金融市场存在太多的变数和未知的未知数,以及不可知的未知数,以人工智能目前的发展状况来看,这些都是需要解决的问题。

在定量分析中,人工智能必须处理的那类金融市场数据是“不稳定的”

静态数据的一个例子可能是距离,比如,你的车道到你的门的距离。 如果没有地震或改造,这个距离很可能保持不变,如果一台机器收到了你的车道和门的数百张照片,它很可能能够识别出你的家。

但是,金融市场上充斥着的数据可能会以前所未有和不可预见的方式发生巨大变化——例如,上世纪90年代俄罗斯主权债务违约时。

加密货币就不是这样了。

作为一种不受约束的资产,与其它资产的相关性有限,在交易加密货币时需要考虑的数据集要少得多——其中许多是投机性的,许多是相互依赖的,这导致金融市场的模式比其它市场的模式要可预测得多。

另一方面,股市一直在波动,而且并不总是出于任何明显的原因,大多数市场的波动被经济学家称为“噪音”交易。

回到你的门和你的车道的类比,想象一下,如果一台电脑试图识别你的家,而不是基于你的家的照片拍摄的日夜和不同的照明条件。

这些图片中的大部分数据都是“噪音” ,更糟糕的是,其中一些图片中的光线至少会导致“假阳性” ,这可能导致计算机将别人的家误认为你的家。

随着数据集的发展,历史股票价格数据并不是特别庞大,这意味着,如果数据量较大,那些看似重要的数据点实际上可能微不足道ーー就像图表上的波峰和波谷往往在较长时间内随着数据量的增加而变得平滑一样。

为了说明这个困难,假设你试图预测股票在一年内的表现。 因为从1900年开始只有可靠的库存信息,所以只有118个不重叠的一年期可用于检查目的。

相比之下,Facebook 每天处理的图片数量不少于3.5亿张。

与检查金融数据(可能被篡改或歪曲)不同,电脑检查照片要容易得多,因为旋转图像或调整对比度等简单技巧可以增加可用于评估的数据量ーー不幸的是,人工智能无法对金融数据进行数字增强。

有限数据及有限边缘

显而易见的信号,比如每个月的第一天买入股票,价值有限,即使它们在过去有效,也可能更多地是巧合的产物,而不是任何预测技巧的反映。

而且,即使发现这些“明显信号”的不仅仅是运气,由于金融市场交易的相对透明度,这些优势也会很快被发现,任何利润都会被交易掉。

因此,许多分析师没有试图寻找“明显的信号” ,而是转向预测那些微妙的信号——这些信号对未来价格的确定性只有51% 。

尽管这听起来可能不像是很有信心,但考虑到在赌场中,51% 的优势是大多数桌面(纸牌)游戏(如 Blackjack 和 Baccarat)的平均庄家优势,而且足以确保从长远来看,庄家总是赢家。

部署此类策略的对冲基金也是如此。

通过大量带有小优势的非常小的赌注,比如51% ,并利用杠杆作用将这些赌注榨干,基金经理可以获得与实际投资规模相当的巨额回报。

在加密货币市场上,51% 的优势不仅是可能的,而且相对来说也很普通。

因为监控的信号要少得多,而且因为“噪音”更容易识别和分离,交易优势可能远远大于51% 。

不像金融市场,不管交易规模大小,都有最低的订单规模和最低的经纪费用,加密货币市场通常在每笔交易中都有一定的比例,不管交易规模大小。

这意味着,即便是交易数量相对较少的加密货币交易员,也可能获得 alpha 回报,就好像他或她是一只大型对冲基金一样,无论交易规模大小,他们都会获得几个基点的交易费。

金融市场则不然,这就是为什么许多基金经理希望通过降低交易成本来提高回报率。 因为,如前所述,在金融市场中,每笔交易无论大小都会吸引最低成本。

经理人削减成本的另一个方法是减少延误,延误是购买特定证券的实际成本,而不是目标价。

举例来说,通用汽车公司的股票价格是100美元,但只有100股股票可用的价格,如果你想购买1000股通用汽车公司的股票,你需要提高价格,这可能导致你的股票的平均成本为105美元甚至更多,比你的目标价格高出5% 。

滑点的问题在于,如果不在市场上进行交易,很难预测证券的实际价格或成本。

例如,即使卖出队列似乎充满了卖家,一个突然的举动,例如购买大量的直到那时的非流动性股票,可能会使卖家认为他们可以为他们的股票取得一个更好的价格或自动交易程序可能会立即撤回他们的卖出订单,迫使价格上涨,尽管没有重要的理由价格上升,除了撤回流动性。

流动性的棘手问题

同样的市场行为也可以在加密货币市场上观察到。以比特币为例。

根据你打算从哪家加密货币交易所购买比特币,以及购买多少比特币,你可能成为比特币的市场,你的行动会影响比特币的总体价格。

这就是为什么当投资者寻求获得大量比特币时,他们往往会将购买分散到各种加密货币交易所,其中许多人还使用场外交易或场外交易,这些交易都是场外交易,不会影响比特币在公开市场上的价格。

虽然很多人使用 CoinMarketCap (一个网站)来确定比特币的价格,但它远非权威,它使用一种严密保护的算法来确定各种未披露来源的比特币的混合价格ーー几乎不具透明度。

但幸运的是,计算机可以预测交易成本,这在两个方面帮助了交易者。

首先,如果一个算法能够根据订单规模和历史流动性有效地预测可能出现的延误,交易信号所需的优势可能会从51% 降到50.5% ,这意味着可以进行更多的交易,从而产生更多的获利机会。

更多的交易也意味着,根据大数定律,达到目标赔率的机会更大。

减少滑点的第二个方法是从现有的机会中挤出更多的利润。

例如,一个广为人知的模型认为比特币被低估了1% 。

在不了解交易成本的情况下,交易员可能只购买100比特币,以免出现过多的滑点,从而将比特币价格推高到它希望获取的1% 以上。

但是另一个交易者用一种算法可以预测交易成本,概率可能达到80% ,他可能知道500比特币可以购买,而比特币的价格不会超过1% 。

能够有效预测和定价交易成本的交易者可以将其收益提高500% ——这在任何市场中都是一个巨大的优势,并对长期收益产生重大影响。

为了进一步压缩交易成本,一些定量基金经理建立了自己的高频交易交易业务,在这些业务中,他们可以充当做市商,通过撮合买家和卖家来赚取利润。

在加密货币市场上,做市商(我的公司只是其中之一)也使用做市算法,为加密货币交易和匹配买卖双方提供持续的流动性。

运行这些做市商操作不仅有助于盈利,而且还提供了对市场行为的深入洞察。

这有点像你在纽约证券交易所拥有自己的员工,而不是使用经纪公司。

一些挣扎于市场数据的定量经理正在寻找其他类型的信息来挖掘,而不仅仅是市场告诉他们的信息。

无论是大宗商品交易商使用饲料批量的卫星照片,还是社交媒体的饲料,替代数据可能会提供一些帮助,尤其是在传统数据要么繁琐或不可靠的情况下。

为此,许多加密货币交易商监控 Twitter、 Medium、 Telegram 和 Reddit,从中挖掘潜在的加密货币流动信息,以便在交易中获得优势。

但是,随着这些数据变得越来越容易找到,这些数据提供的优势往往因为寿命不长而受到影响。

研究分支机构的 Rob Arnott 和北卡罗来纳州福夸商学院的 Campbell Harvey 教授警告投资者不要使用机器学习从缺乏深度的数据集中获取投资策略。

阿诺特和哈维甚至提出了一个应用深度学习技术的清单,特别关注具体数据集的深度,因为替代阿诺特建议,类似于驾驶一辆法拉利在土路上。

但是,即使特定地满足了瘦数据集的需求,在将替代数据源应用于深度学习时仍然存在相当大的风险。

由于数据集中哪怕是一点点的偏差都有可能被交易模型发现,从而带来超额回报,因此此类交易模型在未来做出的决定可能是基于一系列错误的正确性或确认偏差ーー这些算法更多地看到了他们被训练注意到的东西。

例如,如果你决定买一辆红色法拉利,你可能会突然发现自己无论到哪里都能看到你想买的车,而事实上,统计学上的可能性是,这辆车出现的情况和以前完全一样,你只是开始注意它了。

因此,新数据和强大的数据挖掘工具的结合是一个潜在的危险组合。因为深度学习工具可以很容易地、不经意地根据现有的偏见进行设计,从而导致基于零散或误解数据的结论或预测。

保持简单愚蠢

由于数据的复杂性以及加密货币和金融市场中的“噪音” ,保持模型尽可能简单是非常有价值的。

尼克 · 帕特森曾是一名研究员,在复兴科技公司工作了十年“文艺复兴使用的一个工具是线性回归,一个高中生可以理解。”

就算不是所有的高中生都能得到线性回归---- 也许学 AP Calc 的学生也能得到---- 这项技术只是一种找到两个变量之间关系的方法。

虽然线性回归可能很难在美元和比特币之间做出判断,但有趣的是,在加密货币本身内部,尤其是在 Ethereum 和比特币之间,确定要容易得多。

但在金融市场,线性回归变得更加棘手。

由于金融市场数据集的非平稳特性,即使线性回归数据被“发现” ,它也可能是基于一组错误的肯定,或者很快演变成一种不同的关系。

这就是为什么人工智能仍然在金融市场的模式决定和预测模型上苦苦挣扎ーー活动部件实在太多了。

自动阿尔法

尽管对冲基金继续投入大量资源,创建交易领域的天网(Skynet,一种虚构的基于神经网络的有意识群体思维和《终结者》(Terminator)系列电影中的人工通用智能系统) ,但在很大程度上,寻找新的市场信。

一些顶尖的定量基金仍雇佣数百名博士攻读数学、计算机科学甚至火箭推进等学科。

在一个高度随机的宇宙中,识别模式的基本核心仍然非常类似于火箭科学。

要建立投资的天网,一个也许不会威胁到随之而来的金融世界的天网,需要研究人员破解因果关系的密码。

因为相关不蕴涵因果,这样一个自主的投资系统,不仅需要检测某只股票的上涨是否伴随着利率的上升,它还需要找到一个很好的理由。

至少到目前为止,在这种批判性思维和分析方面,人类仍然比机器有优势,但人工智能正开始取得进展。

深度学习尤其推动了人工智能领域的最新进展,比如图像识别和语音翻译,这两个众所周知的复杂数据集。

尽管深度学习在金融领域的应用有限,但这并没有阻止研究人员尝试使用它。

卡内基梅隆大学教授 Zachary Lipton 与投资管理公司 Euclidean Technologies 的 John Alberg 共同撰写了一篇论文,试图展示一种可能的方法来解决金融市场数据集中固有的“噪音”问题ーー跟踪公司基本面,如收入或利润率,这些基本面最终决定公司的回报,而不是股价。

但即使是 Lipton 和 Alberg 的方法也有其局限性。

首先,它假设数据的质量是无可挑剔的。 鉴于估值模型和会计准则的多样性和复杂性,金融市场投入的质量差异很大。

其次,由于金融市场一直具有适应性,而且数据集通常不够深入也不够长,即使存在持久的趋势,也几乎看不出来。

在接受英国《金融时报》采访时,投资银行法国兴业银行定量股票研究主管 Andrew Lapthorne 警告说:

“2007年,这台机器在构建2006年的模型时,并不知道金融危机即将来临。”

简单地说,尽管计算机可能能够根据已经发生的事情辨别模式,但它们通常不如预测可能发生的事情——比如互联网的发明、移动计算和自动驾驶汽车的进化——这些都是人工智能通常难以做出的预测,因为它们需要吸收大量高度通用的数据来预测未来的趋势,换句话说,就是批判性的、“开箱即用”的思维。

人工智能和深度学习在金融市场如此挣扎的原因之一是,两种最不可预测的贪婪和恐惧的人类情绪在这个高度竞争的舞台上显现出来。

金融市场在很大程度上决定了人的意义ーー我们所做的一切都是由金融市场直接或间接决定的ーー以至于影响市场价格的因素与受其影响的人一样多种多样。

我们为抵押贷款支付的金额,我们的食物成本,无论我们是开车上班还是步行,所有这些都会回到金融市场,使得预测模型在完全由机器人决定时变得更加困难。

但由于加密货币市场(目前)在实际日常生活中的影响有限,涉及的因素要少得多,而且更具有确定性。

因为大多数加密货币交易是自主的和算法驱动的,模式更容易识别,人类交易行为往往与既定的市场行为形成鲜明对比。

这意味着,如果相对较小的优势,在51% 至55% 的区域寻找加密货币市场,他们几乎可以保证。

当然,问题不在于是否有机会获利,而在于这些利润的规模。

目前,加密货币根本没有必要的数量和流动性,自主交易策略,以部署在大型量子。

算法密码货币交易的回报率可能很高,但除了某些交易量之外,特别是当管理下的资产开始接近数亿美元时,交易员在部署资金时需要更加创造性和谨慎,因为更大规模的交易机会要少得多。

至少到目前为止,人工智能和机器学习离持续击败金融市场还有一段距离,但是稍微调整一下,他们可能离击败加密货币市场更近了一步。

尽管搜寻最终消失的虚幻信号的前景,可能会让一些人放弃从事金融或加密货币交易的工作,但解决棘手问题的诱惑,加上赚大钱的潜力,意味着总会有足够多的人愿意尝试。


   
发稿时主流币价 :
BTC72777.9
ETH1532.01
EOS28.1609

532

好的文章,需要你的鼓励

声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

评论