事件概述
4月24日,国产AI公司深度求索(DeepSeek)正式发布新一代旗舰大模型DeepSeek-V4,并同步开源全部模型权重。这是继V3版本之后的重大迭代,核心突破在于将上下文窗口从128K扩展至100万Token级别,同时保持MIT协议完全开源。
核心亮点
1. 百万级上下文能力
V4系列支持最高100万Token的上下文窗口,约等于一次性处理300万中文字符。这一能力让AI能够真正"读完整本书再讨论",在长文档分析、代码库理解等场景实现质的飞跃。
2. 稀疏注意力技术创新
V4采用DSA稀疏注意力机制,在百万上下文设置下,每个Token的算力消耗仅为V3的27%,KV缓存占用仅为10%。这意味着更低的推理成本和更快的响应速度。
3. Agent能力专项优化
V4针对OpenClaw、Claude Code等主流AI智能体产品进行了深度适配,在代码任务、文档生成等场景表现显著提升。官方建议复杂Agent场景使用"思考模式-极限"。
4. 国产算力深度适配
华为昇腾超节点宣布全面支持DeepSeek-V4,寒武纪同步完成Day 0适配。这标志着国产AI生态在算力层实现关键突破。
5. 价格延续高性价比
V4-Flash API定价为输入1元/百万Token、输出2元/百万Token,V4-Pro为12元和24元。官方表示下半年昇腾950批量上市后,Pro版本价格将大幅下调。
行业影响
DeepSeek-V4的发布对行业有三重意义:
对开发者:开源+低价+长上下文的组合,让中小团队也能构建复杂的AI应用,不再受限于算力成本。
对行业竞争:V4与OpenAI同天发布的GPT-5.5形成正面竞争,两者在技术路线上殊途同归(均强调Agent能力),但在商业模式上各走极端(开源vs闭源)。
对国产生态:华为、寒武纪等国产芯片的快速适配,证明了国产AI产业在摆脱外部依赖方面迈出关键一步。
开源不是终点,而是生态卡位战的起点。
评论列表
Loading...