腾讯混元Hy3 preview登顶全球大模型调用量榜首:国产模型的"用脚投票"胜利

4月29日,OpenRouter发布了最新的全球大模型API调用量排行榜,腾讯混元Hy3 preview超过一众国际竞品,直接冲上了总榜第一。

这消息一出来,科技圈炸了锅。毕竟这可不是什么"国内自嗨"榜单,OpenRouter是全球开发者真实调用的平台,调用量数据就是实打实的"用脚投票"。

这次,国产模型真的站起来了

先说说Hy3 preview是什么。这是腾讯混元重建后推出的第一个模型,总参数295B、激活参数21B的MoE架构,支持256K上下文。从纸面参数看,已经是妥妥的第一梯队。

但参数好看不代表真的有人用。这次OpenRouter的排行榜,可是基于全球开发者的真实API调用数据。开发者们用脚投票选出来的,含金量比什么"benchmark第一"高多了。

更狠的是,在分场景数据里,Hy3 preview在工具调用维度排第一,编程场景排第二。这两个场景可不是"跑分"能跑出来的,得是真刀真枪地用。

代码能力是这次的主打

腾讯混元这次在代码和智能体能力上下了血本。

SWE-Bench Verified、Terminal-Bench 2.0这些主流基准测试,Hy3 preview都取得了相当竞争力的成绩。特别是在代码补全和bug修复场景,据说首token延迟比上一代降低了54%。

CodeBuddy(腾讯的代码助手产品)已经接入了这个模型,用过的开发者反馈:是真快、真准

开发者们怎么看

说实话,消息刚出来的时候,我朋友圈分成了两派。

一派是兴奋派:"国产大模型终于站起来了"、"腾讯这次真的可以"。

另一派是怀疑派:"是不是又是刷的"、"OpenRouter的统计口径有没有问题"。

但仔细看了一下,OpenRouter的统计逻辑是跟踪所有通过其平台调用的API请求,没有刷的可能。而且分场景的数据(工具调用第一、编程第二)太具体了,不是简单刷量能刷出来的。

更关键的是,腾讯同期还把Hy3 preview开源了。开源意味着全世界开发者都能验证、都能跑。如果是刷的,开源之后早就露馅了。

这对行业意味着什么

腾讯混元这次登顶,意义不只是"腾讯厉害"这么简单。

它说明国产大模型在工程化落地、产品化能力上,已经不输国际大厂了。光有技术指标不够,还得有人真的在用、用得顺手。调用量第一,说明产品层面过关了。

对国内开发者来说,这也是个好消息。以后做项目,除了OpenAI、Anthropic,现在有了一个真正可用的国产替代。而且腾讯这套东西对中文场景的优化,确实比很多国际模型强。

最后说两句

腾讯混元Hy3 preview这次登顶,不是终点而是起点。

榜单随时会变化,Claude、GPT、Gemini谁也不会坐以待毙。但不管怎样,今天这一刻是国产大模型的高光时刻,值得记录一下。

期待看到更多国产模型的突破。

上一篇:

下一篇:

发表回复

评论列表

    Loading...

    联系我们

    在线咨询: QQ交谈

    微信:叁叁

    邮件:794033364@qq.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    微信