辽阳pvc管道胶水腾讯新模型发布，姚顺雨交卷了

126 2026-04-30 12:58:55

文 | 新眸辽阳pvc管道胶水，作者 | 李小东

大模型的局上，腾讯终于甩出了张新。

4 月 23 日，腾讯混元 Hy3 preview 语言模型正式发布并开源。这是款快慢思考融的混（MoE）模型，总参数 295B（2950 亿），激活参数 21B，大支持 256K 上下文长度。官给它的定义干脆利落："混元重建后训练的个模型"，以及"混元迄今智能的模型"。

如果把目光往回拉四个月，腾讯 AI 的日子并不好过。今年年会上，马化腾亲口承认"动作慢了"，慢了 9 个月到 1 年。刘炽平复盘，混元像中生背题应考，成绩单好看，上真实考场就露馅。与此同时，字节豆包月活已达 3.45 亿，阿里千问 1.66 亿，而元宝约 5700 万，差距不仅没缩小还在拉大。

所以当 28 岁的姚顺雨——前 OpenAI 研究员、清华姚班出身、互联网受瞩目的天才少年，在去年被正式任命为腾讯" CEO/ 总裁办公室"席 AI 科学时，外界解读只有个意思：腾讯要动真格了。

四个月后，Hy3 preview 上线。交卷时刻似乎到了。

01 场"倒重来"式的重建

Hy3 preview 不是次常规迭代。用腾讯自己的话说，这是场底层工程的重构。2 月，混元重建了预训练和强化学习的基础设施，原有的训练框架没有沿用，姚顺雨到任后在个月内完成了整个基础设施的重建。

重建的向很明确，三个原则：能力体系化、评测真实、价比追求。翻译下就是，不做"偏科生"，不刷榜，不让模型变成钱的底洞。

"不做偏科生"这条尤其值得展开。Hy3 preview 从研发之初就围绕智能体场景做了针对设计，而姚顺雨的判断是，即便是代码智能体的单应用，也涉及理、长文、指令、对话、代码、工具等多种能力的度协同。你不能让模型只会写代码却看不懂文档，或者能聊天但调不了 API。

同时，姚顺雨指出，过去的混元过度追逐榜单成绩，将榜语料放入训练集致数据被污染，影响了真实场景表现。他要求团队"以后不要榜"，主动跳出易被刷榜的公开榜单，通过自建题目、新考试、人工评测、产品众测等多种式来评估模型的"真实战斗力"。

从研发节奏来看，Hy3 preview 于 2026 年 1 月底正式启动训练，从训练到上线用了不到三个月，被腾讯内部定义为混元大模型从"读万卷书"走向"行万里路"、尝试解决真实世界复杂问题的开端。

不到三个月，重建基础设施、定向、训模型、开源发布。这个速度放在大厂体系里，相当激进。

Hy3 preview 核心的技术理念是"快慢思考融"。

这个概念对应的是认知科学中的双系统理论：系统 1（快思考）是快速、自动、直觉式的反应；系统 2（慢思考）是缓慢、度、需要调用大量计资源的理。传统大模型在设计时通常两条路只能选条，要么快但能力有限，要么强但响应慢。

Hy3 preview 的做法是让模型根据任务难度自动选择思考模式：简单任务用快思考，复杂任务切换到慢思考，在速度和能力之间找个优平衡点。

工程上，这套机制依赖 MoE 架构来实现。295B 的总参数中，每次理只激活 21B，激活占比约 7.1。这意味着实际计量远小于个 2950 亿的稠密模型。

慢思考任务会激活多、调用多计资源，快思考任务则只激活少数、节省力。快慢思考的切换不是简单叠加两个模型，而是在个模型内部根据任务自适应用分配计量。

这个设计思路并不新鲜，但能在不到三个月里完成架构选型、训练和上线，背后的工程能力确实不容小觑。

对腾讯这种手握微信、QQ、腾讯文档等海量用户产品的公司来说，理成本的可控很大程度上决定了模型能否真正进入产品，Hy3 preview 的架构选择也正因如此具备了现实的商业考量。

02 不刷榜的底气是什么？

既然说"不榜"，评估体系就得自己建。

腾讯混元提出了 CL-bench 和 CL-bench-Life 两套评测框架辽阳pvc管道胶水，考察模型在长而杂乱的上下文中理解信息、遵循复杂规则并完成任务的能力。这两套框架对应的正是许多真实生产和生活场景里常见、也难被传统榜单覆盖的问题。

在具体能表现上，Hy3 preview 在几个关键基准测试中取得了有竞争力的结果。在编程基准 SWE-Bench Verified 中，Hy3 preview 得分 74.4，相比前代 Hy2 的 53.0 提升过 40，已接近 GLM-4.7 的水平。

在复杂理任务上，Hy3 preview 在 FrontierScience-Olympiad、IMOAnswerBench 等难度理工科理任务中表现突出，全国中学生生物学联赛（CHSBO 2025）等难度理任务中，Hy3 preview 同样取得优异成绩，展现了其在复杂逻辑理上的泛化能力。

虽然没有刻意追求任何单维度的" SOTA "，但 Hy3 preview 在各个向上都展现出了相当均衡的竞争力。这种选择恰好印证了姚顺雨在 AGI-Next 峰会上传递的信号，行业需要跳出"榜"束缚，核心聚焦在真实用户价值。

不过也要看到，Hy3 preview 的某些实测表现并不。

有机构手测试显示，在个覆盖数据抓取、数值计、可视化生成和文本分析的全链路综任务中，Hy3 preview 在数据获取阶段反复受阻，接口认证失败后接连切换多个数据源，部分数据因速率限制缺失而被迫用模拟数据替代；

关键的是，提示词明确要求输出 500 字的跨市场资产配置 Memo，模型却只给出了几行 Bullet point 式的简略配置比例，没有成文的分析段落。

这表明 Hy3 preview 在真实复杂场景下的交付完整仍有不小提升空间。当然，作为款 preview 版本，这些瑕疵大致在预期之内。

除此以外，价格层面可能也是现在受关注的问题之，Hy3 preview 在腾讯云大模型服务平台 TokenHub 上的定价是：输入价格低 1.2 元 / 百万 tokens，输入命中缓存价格 0.4 元 / 百万 tokens，输出价格低 4 元 / 百万 tokens。同时，万能胶厂家腾讯云联混元出的定制 Token Plan 套餐，个人版定价低 28 元 / 月。

放在当前的市场坐标系里，Hy3 preview 的价格并不激进。

作为对比，DeepSeek-V4-Flash 的输入价格为 0.2 元 / 百万 tokens，V4-Pro 在限时优惠后输入缓存命中价格是低至 0.025 元 / 百万 tokens。在 OpenRouter 平台上，DeepSeek-V4-Flash 每百万 Token 的平均输出价仅为 GPT-5.5 Pro 的 1.55 ‰。

但在"百模大战"进入 Agent 时代的当下，腾讯的价格逻辑是清晰的：不拼对低价，追求"能力 - 成本 - 场景"的三角平衡。

21B 的激活参数本身就是张成本的底，结 MoE 架构的理，它为 Agent 场景中频次、长链路的调用提供了个相对可控的成本底座。

换句话说，摸到了 Agent 落地的门槛。

03 腾讯 AI 的底仍然是自有生态

模型的真正价值在于用起来。

Hy3 preview 目前在腾讯云、元宝、ima、CodeBuddy、WorkBuddy、QQ、QQ 浏览器、腾讯文档、腾讯乐享等发上线，微信公众号、和平精英、腾讯新闻、腾讯自选股、腾讯客服、微信读书等多个主线产品也在陆续接入中。

值得留意的是开源生态的接入：Hy3 preview 支持接入 OpenClaw、OpenCode、KiloCode 等流行开源智能体产品。这意味着腾讯不仅在用自己的模型武装自的产品矩阵，也在试图进入广泛的开源智能体生态。

但产品侧的挑战同样直接。元宝此前接入 DeepSeek-R1 后日活暴涨 20 倍，但搜索链路分走混元和 DeepSeek 两套系统，体验不统，留存转化始终是难题。Hy3 preview 接入后，能否解决这个"分流"问题，将是检验模型真实战斗力的次试金。

目前，腾讯旗下大的 AI 应用元宝已接入 Hy3 preview。从微信到 QQ，从腾讯文档到和平精英，腾讯的产品矩阵正在围绕个统的模型底座进行集结。这种"自有生态 + 自有模型"的法，和字节豆包依托火山引擎的路径形成了有趣的对比。

回到 Hy3 preview，发布当天，同天晚上，OpenAI 发布 GPT-5.5。不到 24 小时，DeepSeek V4 预览版跟着上线。

这是个缩影。今年大模型局，对手们出的速度远比外界想象的快。

Meta 前段时间凭 Muse Spark 了个翻身仗，股价当日大涨；Google 的 Gemini 3.1 系列继续保持强势，AI 聊天机器人市场份额已从不到 6 攀升至约 20 以上。国内面，阿里的 Qwen3.6-Max-Preview，月之暗面的 Kimi K2.6。早之前，豆包大模型 2.0 次大版本跨代升，百度也发了 2.4 万亿参数的原生全模态文心大模型 5.0 正式版。

至于 DeepSeek，V4-Pro 在 Agent 能力、世界知识和理能上达到开源模型佳水平，并在两天内连续降价，部分价格降至原价的四十分之，V4-Flash 每百万 tokens 输入缓存命中价格仅为 0.02 元。

行业里有了共识，跟 DeepSeek 拼价格，对任何厂商都不是划的买。

在这背景下，腾讯按自己的节奏走"实用主义 + 生态落地"的路线。正如汤道生此前判断的，主流大模型的能力差距正在缩小，企业的核心需求已不再是拥有好的模型，而是如何通过系统工程把模型的能力大程度发挥出来，真正拉开差距的是"工程化交付能力"。

04 姚顺雨：从"定义下半场"到"交出模型"

奥力斯万能胶厂家联系人：王经理手机：18231788377（微信同号）地址：河北省任丘市北辛庄乡南代河工业区

整件事特别的地在于个人：姚顺雨。

2025 年 4 月，还在 OpenAI 的姚顺雨发表了篇博客《The Second Half》，提出 AI 已经从上半场走到下半场，不再是训练出强的模型，而是如何定义值得解决的问题，用接近真实世界的式评估模型。

这篇博客让他获得了"定义 AI 下半场的人"这样的标签。

加入腾讯后，他需要从提出判断走向落地判断。四个月，套新的基础设施，个新模型，次开源。对于外界来说，Hy3 preview 是个答案的开头。

姚顺雨自己的表态很清醒：" Hy3 preview 是混元大模型重建的步。我们希望通过这次开源和发布，获得来自开源社区和用户的真实反馈，帮助我们提升 Hy3 正式版的实用"。

这番话没有任何夸口的成分，倒像个阶段的项目汇报。

公开信息显示，除了姚顺雨，腾讯在过去年从微软、阿里、DeepSeek 等顶团队引入了不下 10 位 AI 大牛，包括前微软亚洲研究院视觉计组席研究员胡瀚、微软 WizardLM 项目创建者徐灿等。腾讯在 AI 人才上的投入力度，从薪资、职到职责范围，都给了候选人能在业内拿到的几乎水平。

Hy3 preview 不是个天才少年单枪匹马的成果，而是个重新集结后的团队，在个被重建的基础上做出的款产品。

对于腾讯而言，Hy3 preview 本质上是在回答个问题：腾讯大模型到底还行不行？从参数、架构、评测数据和产品落地来看，这份答卷至少在及格线之上。

但个 preview 版本只是起点。在这样个对手环伺、节奏加速的局里，腾讯需要的是个能持续迭代、真正在自有生态里扎根、并终跑出差异化价值的模型体系。

这才是接下来真正值得关注的问题：Hy3 正式版何时到来，腾讯的产品矩阵能否围绕它形成套真正自洽的"模型 - 应用 - 商业"闭环，元宝能否在混元自己的基座上跑出留存和增长，以及，在 Agent 时代真正到来时，腾讯的生态纵能否转化为实际的竞争优势。

四个月前，姚顺雨拿到了张新桌。四个月后，Hy3 preview 是张。接下来怎么，才是看功力的地。

本文系新眸原创，申请转载授权、商务作请联系微信：ycj841642330，添加好友请备注公司和职位。

— END —

多内容，点击下关注

相关词条:不锈钢保温施工塑料管材生产线钢绞线厂家玻璃棉板泡沫板橡塑板专用胶

1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定辽阳pvc管道胶水，并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方，并积极配合修改。
3.凡用户访问本网页，均表示默认详情页的描述，不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》，以此来变相勒索商家索要赔偿的违法恶意行为。

辽阳pvc管道胶水 腾讯新模型发布，姚顺雨交卷了

辽阳pvc管道胶水腾讯新模型发布，姚顺雨交卷了