由于微信限制了第三方应用的跳转,请使用以下方法。
1. 点击右上角的
2. 选择在浏览器中打开
文章转载来源: WolfDAO
10月18日,专注于金融市场的AI研究实验室 nof1 发起了一场史无前例的实验:让6个世界顶级AI模型——GPT-5、Gemini 2.5 Pro、Grok-4、Claude Sonnet 4.5、DeepSeek V3.1、Qwen3 Max——在Hyperliquid上各自管理10,000美元真实资金,进行加密货币实盘交易。

当前排名与账户价值:截至10月30日晚间,最新排名如下:
这份榜单与几天前的数据相比,发生了戏剧性的变化。DeepSeek虽然依然领先,但收益率从95.71%大幅回撤至56.71%,账户价值从$19,570跌至$15,671,蒸发了近$4,000。Qwen3同样经历回撤,从53.68%降至25.20%。更值得注意的是,Claude Sonnet 4.5从微利状态转为亏损7%,而GPT 5的亏损进一步扩大到72%,距离爆仓已不远。
市场处于上升通道,不同模型的策略差异开始显现:


DeepSeek的成功建立在"顺势而为"的基础上:95%时间做多,相信趋势会延续。在上升趋势中,这个策略让它获得了95%的最高收益。但当趋势反转时,同样的策略让它损失了30%。
这暴露了一个关键问题:**趋势跟随策略需要配合有效的止盈和止损机制。**如果只有"让利润奔跑",没有"截断亏损",那么一次大的反转就可能吞噬掉大部分利润。
DeepSeek可能过于相信"长期持仓"的价值,忽略了市场的不确定性。它的单笔最大盈利$7,378来自一笔持有60小时的ETH交易,这次成功经验可能强化了它的"长期主义"信念。但金融市场不是单行道,趋势随时可能反转。

Qwen3用实际表现证明了空仓的价值。它82.4%的空仓时间在上升阶段看似是"错过机会",但在下跌阶段却成了"避免损失"。
回撤26% vs 32%,看似只有6个百分点的差距,但在复利效应下,这个差距会越来越大。更重要的是,Qwen3保留了更多的本金和心理优势,一旦市场企稳,它可以迅速重新建仓。而DeepSeek如果继续回撤,可能会陷入"浮亏-犹豫-错过反弹"的恶性循环。
BTC Buy & Hold的表现是对所有"聪明"AI的一记耳光。这个策略没有任何技术分析,没有复杂的算法,没有频繁的调仓,但它现在排名第三,超越了一半的AI模型。
这个结果告诉我们:在交易中,少犯错比多做对更重要。**Gemini用193次交易亏掉66%,BTC Buy & Hold用0次交易保住了本金。谁更成功?答案显而易见。
除了Qwen3,几乎所有AI都暴露出风险管理的严重缺陷:
这说明,这些AI虽然能够"看懂"市场数据,能够"执行"交易指令,但在风险管理这个交易的核心能力上,它们还远远不够成熟。
看完数据和分析,我们很容易被DeepSeek的56%收益率或Gemini的66%亏损所吸引。但在得出任何结论之前,我们必须正视这场实验本身的系统性局限——这些局限性可能比结果本身更重要。
这场实验从10月18日到30日,只持续了12天。12天在加密市场意味着什么?可能只是一个完整牛熊周期的零头。
我们看到的"上涨-冲顶-回调"恰好是一个完整的小周期,但这更像是运气。如果实验开始于市场顶部,或者遇到了一次"519式"的单日暴跌30%,现在的排名可能完全颠倒。
DeepSeek的56%收益可能高度依赖这12天的行情特征。它的95%做多策略在单边上涨中是王者,但如果遇到3个月的横盘震荡,这个策略会被手续费和反复止损蚕食殆尽。
同样,Qwen3的82%空仓率在震荡市是优势,但在2021年那种疯牛中会跑输到怀疑人生。一个从$10,000涨到$100,000的BTC牛市,空仓80%的时间意味着你只赚到了20%的涨幅。
12天的数据,不足以证明任何策略的长期有效性。
所有6个AI模型接收的是相同的市场数据和交易指令框架。这就像让6个基金经理看同一份研报做决策——你测试的不是他们的研究能力,而是他们的执行纪律。
真实的交易世界里,alpha来自信息不对称。顶级量化基金有独家的链上追踪系统,能看到巨鲸转账;有场外大宗订单流数据,能提前感知机构动向。
但在这场实验里,AI们看到的信息完全相同。这更像是一场"执行力比赛",而非"策略创新比赛"。
我们无法从这个实验中判断,如果给DeepSeek独家的链上数据,给Gemini独家的Twitter情绪分析,谁会是真正的赢家。
每个AI只管理$10,000本金。这在Hyperliquid上属于超小规模资金——你可以随时进出,滑点可以忽略,流动性冲击不存在,大单拆分完全不需要考虑。
但真实的量化交易世界里,管理$1,000万和管理$10,000是两个物种。
这场实验测试的是"小资金的灵活性",而非"可扩展策略的稳健性"。
实验期间的市场相对平稳,波动率处于中等水平。我们没有看到:
所有AI的风控体系都未经极端压力测试,而这些才是加密交易者真正需要面临的挑战。DeepSeek的止损机制在遇到"连续跌停无法成交"时会怎样?我们不知道。Qwen3的快速平仓在交易所宕机时还有效吗?也不知道。
运气,在12天的实验里,占比可能比我们想象的大得多。
这是一次性的实验,没有"第二季"来验证策略的稳定性。我们无法判断:
现在的结果,更像是6个人掷骰子,DeepSeek恰好掷出了最大的点数。但这不代表它的骰子更好,可能只是运气更好。
看完这些局限性,你可能会问:那这场实验还有意义吗?
有,但意义不在于"谁是冠军"。这场实验的真正价值,是让我们看到:
但如果你因为看到DeepSeek排第一,就准备把自己的钱交给它管理,或者照搬它的策略,那就大错特错了。
12天的冠军,不代表12个月的冠军;$10,000的冠军,不代表$1,000,000的冠军;这段行情的冠军,不代表下段行情的冠军。
投资这件事,从来没有简单的答案。这场实验给了我们珍贵的数据,但数据背后的局限性,可能比数据本身更值得深思。
本期报告数据由 WolfDAO 编辑整理,如有疑问可联系我们进行更新处理;
撰稿:Riffi / WolfDAO( X : @10xWolfdao )
来源:WolfDAO
发布人:暖色
声明:该文观点仅代表作者本人,不代表火讯财经立场。火讯财经系信息发布平台,仅提供信息存储空间服务。
如文章涉及侵权, 请及时致函告之,本站将第⼀时间删除⽂章。邮箱:840034348@qq.com