热点新闻

来源：吴晓波频道CHANNELWU

“谁如果把这个AI交易工具给做出来了，我马上投！”

最近，国外一家叫做nof1的人工智能实验室，发起了一个叫做“Alpha Arena”的项目，该项目将全球六大顶尖AI模型：DeepSeek、Grok、ChatGPT、Gemini、Qwen、Claude汇聚在一起，投入金融市场进行残酷的“实盘交易”。

按规则，每一个AI大模型掌控一个独立的1万美元账户，六大模型自己拟定投资策略进行实盘交易，全部投资过程和决策完全公开，而且账户信息公开透明，杜绝弄虚作假，所有人都可以进行查询。

比赛一开始就引发了AI和数字货币圈层的热议。

截至10月25日凌晨1点，参赛的两款国产大模型在比赛中碾压四款国外大模型。Qwen3 MAX以49%收益率目前保持断崖式领先（最高时收益率达60%以上），DeepSeek以13%收益率紧随其后（最高时35%），而其他四位对手的收益率惨不忍睹。

Claude Sonnet 4.5收益率为-14%，马斯克的Grok 4为-17%，谷歌的Gemini 2.5 Pro录得-67%，垫底的GPT-5最惨，账户净值暴跌-75%。

截至10月24日，账户收益率实时变动中

这场AI大模型的“实弹演习”可谓极富戏剧性。从整个过程来看，开赛当天大家波澜不惊，随后DeepSeek开始领先，而GPT-5、谷歌Gemini则出现大溃败。近日，Qwen3 MAX上演了强势逆袭。

金融，智能的终极测试

本次投资比赛中，六大参赛模型是基于完全相同的市场数据和初始指令，自行掌控10000美元的初始资金，在去中心化交易所上，进行永续合约交易。

评判标准有且只有一个：收益率。

在前置条件完全相同的情况下，影响投资收益率的主要原因，在于这些大模型的“思维方式”。

我们先来回顾下这几天的交易情况。

10月18日当天，大多数人工智能的波动范围在正负2%之间，似乎正在熟悉市场信息，对交易市场进行测试，表现最好的DeepSeek拿到了4%的利润，而表现最差的是Qwen3 MAX亏损了5.26%。

但到了10月20日，DeepSeek净值曲线一路走高，收益率飙升到25.33%，而表现最差的谷歌Gemini暴跌-39.38%，两者收益率相差60%，市场出现巨大分化。

10月20日，DeepSeek异军突起

转折点出现在10月22日。当时，六只大模型的收益率全部告负，号称最强大模型的GPT-5的亏损率超过60%，AI驱动交易的实验一度要接近失败。

而就在这时，DeepSeek和以及此前表现不佳的Qwen3 MAX纷纷自动改写了投资策略，在其他4个大模型持续亏损的情况下脱颖而出，净值曲线波动上涨，Qwen3 MAX更是趁机超过DeepSeek，暂时问鼎收益冠军。

Qwen3 MAX超过DeepSeek

六大模型

有“巴菲特”也有“大韭菜”

仔细分析六大模型的投资风格，就会发现AI也和人类一样，拥有自己鲜明的投资风格。

首先我们来看“量化老兵”，也就是母公司幻方量化研发的DeepSeek。

DeepSeek的投资策略可以说是“大道至简”。它从参赛开始就买入BTC、ETH等主流虚拟货币，然后就如老僧入定一般以10倍杠杆坚定持有，像极了巴菲特的“价值投资”。

截至10月24日，DeepSeek持仓时间中位数长达38小时32分钟，排名六大模型第一。

截至10月24日，账户收益率实时变动中

如果说DeepSeek是巴菲特的投资信徒，那Gemini2.5pro在K线图前显得有些心神不宁，它是所有大模型中操作最频繁的选手，平均持仓时间仅有2小时29分钟。

它的投资策略像散户一样摇摆不定，时而做多，时而做空，短短几天时间就完成了60多笔交易，不仅被围观群众戏称为“微操大师”，而且收益率表现也非常难看。

截至10月24日，账户收益率实时变动中

此外，还有两个“激进大模型”Grok-4和Qwen3 MAX。

马斯克旗下的Grok，风格如其主人一般不羁，满仓多个标的，高杠杆跟踪趋势，收益曲线大起大落，像一个风险偏好极高的对冲基金经理。

10月21日，Grok-4的收益率一度高达50%，这个收益率距离排名第一的DeepSeek仅有1美元的差距。然而，激进的策略导致其在市场回调中迅速回吐利润，甚至目前还亏损中。

截至10月24日，账户收益率实时变动中

Qwen3 MAX则更为极端，每天都在“All in”一个标的，它目前是满仓BTC，但杠杆高达20倍。

在这种策略下，方向对了，一夜暴富不是梦想；方向错了，便损失惨重，这种孤注一掷的风格，让它的净值曲线充满了让人心惊肉跳的猛烈波动。

截至10月24日，账户收益率实时变动中

尽管如此，在唯结果论的前提下，Qwen3 MAX目前的表现无疑是最优秀的。

最后再来看名声在外的大模型GPT-5和Claude Sonnet 4.5。

Claude Sonnet 4.5极少开单，杠杆为10倍，谨慎得就像一个保守的基金经理。最近几天战绩互有胜负，但波动不大。

截至10月24日，账户收益率实时变动中

而GPT-5表现则极度糟糕，从10月19日开始，它的净值便持续下跌且其胜率低得可怜，仅有6%。由不得网友调侃，它可能是最像人的大模型，毕竟韭菜味儿十足。

截至10月24日，账户收益率实时变动中

nof1让六大模型在金融市场竞争的真正目的并非赚钱，而是进行一场大型“金融图灵测试”。

团队认为，人类的金融市场是“智能的终极考验”。若AI能在市场中持续盈利，则证明了它在真实且高度不确定的环境中，拥有超越人类金融专家的能力，这将被视为AI领域的又一座“圣杯”。

换言之，nof1想通过实验回答一个问题：人类社会当下最聪明的AI大模型，能否在残酷的金融市场存活下来？

人均量化交易员来了？

“Alpha Arena”项目的出现，意味着AI驱动的交易将走上历史舞台。在未来，顶尖的金融大模型，会比顶尖的交易员更加重要。

nof1曾经在项目文件中提出了一个问题“我们是否需要用新的架构来训练投资模型，或者LLMs就足够了？等到美东时间2025年11月3日比赛结束，我们或许就能知道答案。

不过，无论哪个大模型在这次比赛中胜出，或都意味着一个新的时代到来：“技术将决定资本。”

数据显示，2023年全球加密货币算法交易量高达94万亿美元，其中70%的交易量是由机器人完成，数字货币市场，已成为全球自动化交易算法最普及的市场。

而在美股市场，程序化交易占比在50%以上，高频交易方面，美国达到50%左右，欧洲在35%左右。在国外，量化交易是一个早就习以为常的老旧名词。

就算在程序化交易相对保守的A股，量化交易占比也在大幅提升：截至2024年7月份，我国程序化交易占比已经从2020年的20%上升至目前的34%，高频交易占比从10%上升到21%。

此外，今年以来，已有二十多家国内券商也已经开通面向投资者的“T0算法”服务，这种日内回转交易算法，将AI和量化交易能力内嵌到APP之中，让普通投资者也可以享受到到机构交易同等级别的自动化交易工具。

相比于传统的量化交易，AI驱动交易可以看成是量化交易的“进阶形态”。

量化交易的核心逻辑是执行预设的、固定的数学模型与交易规则，策略相对固定，在市场风格转变时可能失效，无需人工干预调整。

而AI驱动交易则是让AI大模型从在接入市场数据后自主学习市场规律，甚至能够根据新闻报道、社交媒体、机构研报自主动态调整交易策略，极大减少人工干预。

与此同时，随着比赛的出圈，个人投资者开始思考：如果我用同样的提示词，选择一个“冠军AI大模型”，那么它是否能够代替我进行投资？

答案并没有那么简单，金融大鳄乔治·索罗斯很早就提到了一个著名的概念：反身性。

在索罗斯看来，市场参与者的认知会影响市场本身，而市场的变化又反过来影响参与者的认知，所以当AI进行交易的同时，就会改变市场，从而影响其他AI的交易决策。

因此，尽管“Alpha Arena”项目能够决出一个经过金融市场考验的AI大模型，但当越来越多的人用相同的提示词去训练同样大模型的时候，这个必胜的“AI驱动策略”就会因为使用的人越来越多而失效。

比如，如果所有人都预期DeepSeek会买入某个投资产品而进行提前布局，那么其策略的有效性便会大打折扣。

举个例子，2010年，美国道琼斯工业指数就出现了一次“闪电崩盘”，一家资产管理公司发出的量化交易卖盘“触发”了其他的量化交易的算法，导致各大机构纷纷抛售股票，短时间内指数便暴跌9%，道琼斯指数蒸发7000亿美元。

基于同样的逻辑，如果未来的AI交易模型都基于相同的大模型，拥有了相似的训练数据和策略逻辑，那么一旦市场出现了黑天鹅，触发了所有AI的卖出指令，是否会出现比2010年更严重的踩踏危机？

很显然，交易的圣杯或许会短暂存在，但它绝不是永恒的。

所以对普通人而言，跟着AI抄作业，甚至是让AI代替自己进行投资，仍然是一件值得商榷的事情。

毕竟，所有人都知道的财富密码，就不再是密码了。

本篇作者 |王振超| 责任编辑 | 何梦飞

主编 | 何梦飞 | 图源 | VCG、网络

特别声明：以上内容仅代表作者本人的观点或立场，不代表新浪财经头条的观点或立场。如因作品内容、版权或其他问题需要与新浪财经头条联系的，请于上述内容发布后的30天内进行。

国外办了场AI投资实盘大赛，国产大模型目前断档式领先

图源：网络

图源：网络

相关推荐