4月17日深夜,Anthropic突然发布了Claude Opus 4.7。这距离上一个版本才没多久,更新节奏明显加快了。
说真的,这次有点东西。
代码能力直接屠榜
根据MCP-Atlas的评测数据,Opus 4.7在工具调用上跑出了77.3%的成绩。什么概念呢?GPT-5.4是68.1%,Gemini是73.9%,它直接把这俩甩在身后了。
我翻了翻Anthropic的官方文档,发现他们提到了一个有意思的改进:以前的模型多多少少会"自己加戏"——你让它写个函数,它可能顺便帮你重构了整个模块;你说"帮我查一下",它可能直接把数据可视化做完了。
现在不一样了。Opus 4.7会严格按照你的指令来,不会自己给自己加戏。这一点对需要精确控制的开发者来说,挺重要的。
金融分析直接登顶
在金融分析代理测试中,Opus 4.7拿下了全球最高分。这个可能跟普通人关系不大,但如果你是做量化、投研、风控的,这条信息值得留意。
有意思的是,Anthropic这次特别强调了安全性。内置了网络安全防护,能自动检测和阻止高风险请求。这在金融场景下太重要了——谁也不想让AI帮忙分析的时候,顺便把敏感数据泄露出去。
中文能力是个小遗憾
不过要泼点冷水:Claude的中文能力还是比国产模型弱一些。如果你主要处理中文文档,Opus 4.7可能不是最优选。
反过来,如果你做跨境业务、写代码、或者做英文材料分析,那Opus 4.7这次的表现确实值得试试。
适合谁用
总结一下:程序员、开发者、金融分析师、需要处理高安全性任务的专业用户。普通用户的话,20美元一个月的Claude订阅够用了,这个Pro版本有点奢侈。
对了,就在发布Opus 4.7的前不久,Anthropic还放出了一个叫Mythos的预览版,官方说这是"迄今为止最强大的AI模型"。有多强?反正比Opus 4.6还强。
有兴趣的可以去官网看看申请方式,不过目前主要面向安全研究合作伙伴。
说到底,AI军备竞赛还在继续。GPT-5.4、Claude Opus 4.7、Gemini 3.1 Pro,三足鼎立的格局短期内不会变。对用户来说是好事——选择多了,价格战也快了。
你怎么选?评论区聊聊。
评论列表
Loading...