OpenAI昨晚扔下了一颗重磅炸弹。
代号"Spud(土豆)"的GPT-6正式发布,历经18个月研发、3月17日完成预训练后,终于在4月14日向全球同步上线。这个时间点选得很有意思——正好是斯坦福AI指数报告发布后的第二天,像是专门来抢头条的。
200万Token上下文是什么概念
之前GPT-5.4的100万Token已经让很多人直呼"离谱"了,这次GPT-6直接翻倍到200万Token。
换算一下:200万Token大约相当于150万中文字,或者20万行代码。这意味着你可以丢给它一整个代码仓库,让它从头到尾理解上下文,然后帮你重构;或者扔进去几百篇论文,让它帮你梳理研究脉络。
官方还预告了一个更夸张的数字——GPT-5.1预览版已经在灰度测试千万级Token上下文(1000万Token),预计下个月正式开放API。这已经不是"记忆力"了,这是"过目不忘"级别的存在。
性能提升40%,但价格没涨
这是最让人意外的部分。性能涨了四成,但定价保持稳定:输入每百万Token 2.5美元,输出12美元。OpenAI这是要和字节的Seed系列打价格战的意思。
不过也有分析认为这只是首发定价策略,后续可能会调整。不管怎样,对开发者和企业用户来说,能用同样的钱买到更强的能力,总归是好事。
原生多模态统一处理才是大招
比上下文窗口更值得关注的,是这次架构上的突破——Symphony双系统推理架构。
简单来说,文本、音频、图像、视频输入被统一编码,模型"所见即所懂",不再需要外部模块拼接。之前的多模态模型,本质上是几个模块粘在一起,各管各的。GPT-6从底层就打通了,这意味着它的理解能力会更连贯、更接近人类感知世界的方式。
还有一个新功能叫"中途响应可控"(Mid-response Steerability),支持对话过程中实时调整AI输出方向。之前的AI,要么答完才停,要么答非所问中途打断很生硬。现在你可以随时喊停,让它换个方向继续。这个功能在GPT-5.4上已经能体验了。
诸神混战:对手们也没闲着
就在GPT-6发布同一天,AI战场三路"奇兵"同时出击:
加上之前谷歌的Gemini 3.1 Pro、Anthropic的Claude 4.6,现在TOP 5的格局是中美五五开——Claude Opus 4.6(美国)、Grok 4.20(美国xAI)、Gemini 3.1 Pro(谷歌)、GPT-5.3(OpenAI)、Qwen 3.5/Seed 2.0 Pro(阿里/字节)。
"封神周期"从年变成了月。没有任何一个模型能长期垄断榜首,领先位置的保质期越来越短。
对普通用户意味着什么
说实话,现在谈实际影响还太早。GPT-6的API预计6月才面向公众开放,普通人想直接用上还得等几个月。
但有几个趋势已经很清楚了:
写在最后
每次旗舰模型发布,媒体都会写"这标志着AI进入新时代"。
但这次可能真的不太一样。200万Token不是小打小闹的升级,原生多模态打通也不是简单的功能叠加。AI从"能回答问题"到"能处理完整项目",从"理解文字"到"感知世界",这个转变正在加速。
当然,隐患也摆在那儿:最强的AI模型透明度反而在下降(斯坦福报告里专门提到了这点),能源消耗越来越高,环境成本越来越吓人。这些问题不会因为模型变强就自动消失。
先别急着激动,6月API开放后再看实际效果。但有一点可以确定:AI军备竞赛,已经从"比谁参数大"变成了"比谁工程闭环跑得通"。
评论列表
Loading...