行业

请登录登录

不用等R2了！第三方给新版DeepSeek V3添加深度思考，推理101秒破解7米甘蔗过2米门

量子位 2025-05-05 21:48:51

科技

由华为云驱动

新版DeepSeek V3-0324加入深度思考，由TNG Technology Consulting团队开发的R1T-Chimera模型在解决难题时思考101秒。该模型融合了V3-0324和R1两个模型，输出token减少40%，速度更快。虽然无法直观理解三维空间，但通过计算夹角与投影得出答案。

DeepSeek即将发布R2？？坊间传闻越来越多了，且难辨真假。

1.2T万亿参数，5.2PB训练数据，高效利用华为芯片……只能说如果有一半是真的都很牛了。

HuggingFace创始人此时推荐“以不变应万变”，打开官方认证账号的更新提醒，就能第一时间获取通知。

抛开具体泄露数据是否准确，大家似乎有一个共识：如果真的有R2，它的基础模型会是新版DeepSeek V3-0324。

之所以有很多人相信R2会在4月底发布，有一部分原因也是出于R1与V3之间相隔了一个月左右。

现在，等不及DeepSeek官方，开源社区已经开始自己动手给V3-0324加入深度思考了。

新模型DeepSeek-R1T-Chimera，能力与原版R1相当，但速度更快，输出token减少40%，也是基于MIT协议开放权重。

相当于拥有接近R1的能力和接近V3-0324的速度，结合了两者的优点。

而且做到这一点，不是靠微调或蒸馏，而是DeepSeek V3-0324和R1两个模型融合而成。

R1+V3融合模型

新模型R1T-Chimera并非DeepSeek官方出品，而是来自德国团队TNG Technology Consulting。

该团队此前也探索过可调专家混合（MoTE）方法，让DeepSeek-R1在推理部署时可以改变行为。

新的R1T-Chimera模型权重可在HuggingFace下载，也可以在OpenRouter免费在线试玩。

目前已知是选用了V3-0324的共享专家+R1与V3-0324的路由专家的混合体融合而来。

TNG团队表示最终结果令人惊讶，不仅没有表现出融合模型的缺陷，相反，思考过程还比原版R1更紧凑有序。

暂没有技术报告或更详细的模型融合方法公布，要验证它是否符合描述，就只能拉出来试一试了。

我们选用最新折磨AI的难题“7米长的甘蔗如何通过2米高1米宽的门？”。

原版R1思考了13秒就下了结论；R1T Chimera在这里却足足思考了101秒，最终计算出可以通过。

虽然还是无法像人类一样直观的理解三维空间，让甘蔗与门的平面垂直就可通过，但依然通过计算夹角与投影得出了结论。

在这100秒时间里R1T-Chimera如何一步步思考出答案呢？

展开推理token可以发现，在简单计算二维方案不可行后，它就已经想到了三维方案。

后面依然陷入了各种误区，在旋转甘蔗、弯曲甘蔗、计算“门的厚度”上走了弯路。

最终通过“揣摩出题人心理”走进正确的路线。

最终给出的答案非常严谨了。

虽然人类直觉上就能想出把甘蔗垂直起来通过这个方法，但仔细一想，题目中确实没有给出“门后有多少空间这个条件”。

细还是AI细。

关于R1T-Chimera的更多细节，大家还在等TNG团队消息和更多第三方基准测试结果。

不过也有人注意到，KIMI K1.5技术报告中也探索了模型融合方法。

不过在实验中，这种简单融合方法表现并不如这篇论文中提出的Long2short强化学习方法。

另一个在模型融合上有经验的团队是Transformer作者Llion Jones创办的Sakana AI。

早在24年初就结合进化算法提出以block为单位融合的方法。

随着更多团队跟进这一路线，模型融合会不会成为2025年大模型的一大技术趋势呢？欢迎在评论区留下你的看法。

本文来源：量子位

点击展开全文

网友评论

聚超值推荐

韶音（SHOKZ）OpenRun Pro 2 S820开放式蓝牙耳机骨传导耳机运动跑步骑行无线耳机超长续航砂石黑 券后省0.9 ￥988.2 ￥1098

HIKVISION 海康威视太阳能监控摄像头免流量免充值室外防水监控器360度无死角高清户外防水T1S4M带256G卡 券后省20 ￥594 ￥614

索尼（SONY）WF-1000XM5【政府补贴】真无线蓝牙降噪耳机新一代降噪豆智能AI 蓝牙5.3 黑色双11 购物推荐 券后省0.9 ￥1439.1 ￥1599

雷蛇（Razer）利维坦巨兽V2 X 游戏条形音箱 RGB灯效电脑桌面音箱黑神话悟空 券后省60 ￥539 ￥599

倍思（Baseus）磁吸无线充车载支架充电器 40W 出风口版加强挂钩款(15w无线充+25w USB口) 每满300减50 ￥95 ￥125

绿巨能（llano）笔记本压风式散热器V10游戏电脑支架底座大风力调速适用联想戴尔外星人拯救者华硕ROG无灯版 券后省0.9 ￥197.1 ￥219

飞利浦（PHILIPS）蓝牙耳机耳夹式无线开放挂耳式骨传导概念运动跑步通话降噪适用华为苹果 TAT4469 黑双十一活动 券后省20 ￥156 ￥176

ulanzi 优篮子 MT-24迷你相机金属桌面延长三脚架VLOG便携阿卡冷靴金属云台套装 券后省0.9 ￥168.3 ￥187

漫步者（EDIFIER）G30S 雷霆版头戴式无线蓝牙耳机头戴式双模游戏多平台兼容电脑网课办公会议电竞吃鸡耳麦听声辨位 G30S经典黑+耳机支架 券后省10 ￥179 ￥189

相关推荐

「高贵」的玛莎拉蒂，降到35万了 科技要闻新技术

「高贵」的玛莎拉蒂，降到35万了

华为刚出了一台Mate 70 Air，但我觉得它没那么 Air。。。 科技要闻新技术

华为刚出了一台Mate 70 Air，但我觉得它没那么 Air。。。

承认吧：手机越来越无聊了，要允许好玩的怪东西存在 科技要闻新技术

承认吧：手机越来越无聊了，要允许好玩的怪东西存在

Z时代的豪华，奔驰交出了高分答卷 科技要闻新技术

Z时代的豪华，奔驰交出了高分答卷

看完94万的宝马M3旅行版，我的眼泪从嘴角流了下来。 科技要闻新技术

看完94万的宝马M3旅行版，我的眼泪从嘴角流了下来。

OpenAI“杀”疯了！又一笔380亿大单，连对手的“金主爸爸”都不放过 科技要闻新技术

OpenAI“杀”疯了！又一笔380亿大单，连对手的“金主爸爸”都不放过

小成本DeepSeek和Kimi，正攻破奥特曼的「算力护城河」 科技要闻新技术

小成本DeepSeek和Kimi，正攻破奥特曼的「算力护城河」

大部分人不知道的 AI 抖音，居然是最「反抖音」的产品 科技要闻新技术

大部分人不知道的 AI 抖音，居然是最「反抖音」的产品

iOS这次更新，苹果终于把液态玻璃开关交给了用户。 科技要闻新技术

iOS这次更新，苹果终于把液态玻璃开关交给了用户。

谷歌Gemini闹乌龙：我家狗子，竟被AI开除了「狗籍」！ 科技要闻新技术

谷歌Gemini闹乌龙：我家狗子，竟被AI开除了「狗籍」！

相关产品